You are on page 1of 34

GUA PARA LA INTERPRETACIN DE

RESULTADOS EN EL CONTRASTE DE
HIPTESIS ESTADSTICAS
(Estadstica Paramtrica y No Paramtrica)

Autor: Enrique Navarro Asencio


(@eduktive)
https://eduktive.wordpress.com/
Versin 5
26/01/2015

Enrique Navarro Asencio (@eduktive)

NDICE
1. ESTADSTICA DESCRIPTIVA E INFERENCIA ESTADSTICA ....................................................................... 2
1.1 Variables en la investigacin .......................................................................................................................... 3
1.2 Formulacin de hiptesis estadsticas ........................................................................................................... 5
1.3 Distribucin Muestral..................................................................................................................................... 6
1.4 Estadsticos de contraste y probabilidad asociada........................................................................................ 7
Nivel de significacin ....................................................................................................................................... 9
1.5 Clasificacin de Anlisis estadsticos para el contraste de hiptesis. ........................................................ 10
Grupos Relacionados vs. Grupos Independientes ........................................................................................ 12
1.6 Software para el contraste de hiptesis y anlisis de datos. ....................................................................... 13
2. PRUEBAS ESTADSTICAS (PARAMTRICAS Y NO PARAMTRICAS) ...................................................... 14
2.1 Pruebas paramtricas de Diferencias entre grupos .................................................................................... 14
2.1.1 Diferencias entre las puntuaciones de DOS grupos INDEPENDIENTES. Prueba T de Student ...... 14
2.1.2 Diferencias entre las puntuaciones de TRES o ms grupos INDEPENDIENTES. Anlisis de
Varianza (ANOVA) ......................................................................................................................................... 16
2.1.3 Diferencias entre las puntuaciones de DOS grupos RELACIONADOS. Prueba T de Student .......... 18
2.1.4 Comparacin de un nico grupo. Prueba T de Student ...................................................................... 19
2.2 Pruebas paramtricas de Relacin entre variables.....................................................................................20
2.2.1 Correlacin entre dos variables cuantitativas. Pearson ......................................................................20
2.3 Pruebas No paramtricas de Diferencias entre grupos .............................................................................. 23
2.3.1 Diferencias entre las puntuaciones de DOS grupos INDEPENDIENTES. Prueba U de MannWhitney........................................................................................................................................................... 23
2.3.2 Diferencias entre las puntuaciones de TRES o ms grupos independientes. Prueba H de KruskalWallys.............................................................................................................................................................. 25
2.3.3 Diferencias entre las puntuaciones de DOS grupos relacionados. Prueba W de Wilcoxon. ............. 26
2.3.4 Diferencias entre las puntuaciones de DOS grupos relacionados. Prueba McNemar ...................... 27
2.3.5 Comparacin de un nico grupo. Chi-Cuadrado como bondad de ajuste. ........................................ 28
2.4 Pruebas No Paramtricas de relaciones entre variables ............................................................................ 29
2.4.1 Correlacin entre dos variables cualitativas ordinales. Spearman, tau-b, tau-c y gamma ...............30
2.4.2 Correlacin entre dos variables cualitativas nominales. Chi-Cuadrado para la independencia ...... 31
2.4.2 Correlacin entre una variable cualitativa nominal dicotmica y una variable cuantitativa ........... 33

Enrique Navarro Asencio (@eduktive)

Esta gua pretende llevar a cabo una introduccin a los conceptos bsicos del contraste de hiptesis
estadstico. Con su lectura se puede dar respuesta a dos preguntas fundamentales: Qu tipo de
anlisis estadstico es adecuado para analizar los datos? y cmo se interpreta esa informacin
estadstica?

1. ESTADSTICA DESCRIPTIVA E INFERENCIA ESTADSTICA


El anlisis estadstico puede agruparse en dos vertientes diferenciadas. Por un lado, la estadstica
descriptiva, que se encarga de describir las caractersticas de los sujetos que forman parte del
estudio para presentar la informacin de forma organizada y resumida, por ejemplo, qu cantidad
o proporcin de mujeres y hombres, sus edades, sus niveles en las variable de inters, etc. Y, por
otro, la estadstica inferencial que trata de contrastar hiptesis partir de los datos de la muestra
para que puedan generalizarse a la poblacin.
Esta generalizacin de los resultados depender en parte del proceso de seleccin muestral y su
tamao. No obstante, contar con muestras pequeas no es un impedimento para realizar
contrastes estadsticos utilizando una metodologa rigurosa y correcta.

Univariada
Descriptiva
Bivariada
(Correlaciones)
Estadstica
Pruebas
Paramtricas
Inferencial
(Contraste de
Hiptesis)
Pruebas No
Paramtricas

Figura 1. Clasificacin de anlisis estadsticos

Esta gua se centra en el segundo grupo de anlisis estadsticos que se utilizan para llevar a cabo el
contraste de hiptesis. Tambin se incluyen los estadsticos para analizar la relacin entre
variables, aunque usualmente se clasifican dentro del grupo de estadsticos descriptivos y se
denominan estadsticos descriptivos bivariados.
La estadstica descriptiva incluye una parte de anlisis de cada variable por separado (univariada) y
otra para establecer relaciones entre pares de variables (bivariada).
La estadstica descriptiva bivariada tambin se puede considerar estadstica inferencial si la
finalidad de la investigacin es generalizar los resultados de correlacin a la poblacin. Si la
2

Enrique Navarro Asencio (@eduktive)

investigacin no tiene ese objetivo y solo pretende describir un grupo de sujetos, las correlaciones
son estadsticos descriptivos.
Esa inferencia, por tanto, permite la generalizacin de los resultados de una muestra a la poblacin
en trminos de probabilidad. Esta generalizacin de los resultados depender principalmente del
proceso de seleccin muestral que debe garantizar la representatividad de la muestra.
Antes de comenzar con la descripcin de las diferentes pruebas que se utilizan para el contraste de
hiptesis en estudios con datos empricos, conviene introducir algunos conceptos bsicos.

1.1 VARIABLES EN LA INVESTIGACIN


Cada vez que se observa un fenmeno o se administra un determinado test, cuestionario o encuesta
a un sujeto, se est llevando a cabo un proceso de medicin de variables. Una variable es una
caracterstica que vara entre los diferentes individuos de una poblacin. La informacin que
disponemos de cada individuo es resumida en variables. Las variables se pueden manipular, medir
o controlar. Y, por definicin, una variable es lo opuesto a una constante.
La informacin cualitativa se recoge mediante tcnicas de recogida de informacin cualitativa,
principalmente la entrevista en sus diversos formatos (grupos de discusin, biogrficas, delphi), y
el producto es contenido textual, en cambio, la informacin cuantitativa se extrae mediante
tcnicas de recogida de informacin cuantitativa (cuestionarios, tests) y se puede codificar de
forma numrica para cuantificarla.
Esa informacin cuantitativa se pude medir a travs de diferentes escalas (escalas nominales,
ordinales, intervalo y razn). Y cada escala es adecuada para medir un tipo de variable
determinado.

Razn

Intervalo:
Ordinal
Nominal:

Los nmeros representan cantidades iguales


El cero significa ausencia del atributo o varible
Permiten cualquier tipo de operacin matemtica.
Ejemplos: ead, euros, velocidad, tamao del aula...

Las distancias iguales entre dos nmeros de la escala


representan la misma diferencia en la varible.
El cero no es absoluto
Ejemplos: temperatura, puntuaciones de test...

Las cateogras pueden ordenarse de mayor a


menor o viceversa.
Ejemplos: tipo Likert, clase social...

los nmeros no representan cantidades.,


slo distinguen entre categoras.
La asignacin de los nmeros a las
categoras es aleatoria
Ejemplos: gnero, raza, tipo de
lateralidad...

FIGURA 2. ESCALA DE MEDIDA DE VARIABLES

Las escalas nominales y ordinales miden variables de naturaleza cualitativa y las de intervalo y
razn las de naturaleza cuantitativa. Por tanto, la recogida de informacin cuantitativa puede
producir variables de naturaleza cuantitativa y cualitativa:
3

Enrique Navarro Asencio (@eduktive)

A) Cualitativas: sus valores (niveles) no se pueden asociar naturalmente a un nmero, es decir,


no se pueden hacer operaciones algebraicas con ellos como sumar o restar los valores de los
diferentes niveles o categoras. Este grupo incluye variables:

Nominales: Si sus valores no se pueden ordenar en funcin de la cantidad o nivel de la


variable. Pueden ser dicotmicas con dos categoras (sexo: hombre-mujer; tems de
verdadero-falso o de s-no, etc.) o politmicas con ms de dos categoras (Grupo Sanguneo,
nacionalidad, etc.). En ocasiones, algunas variables pueden dicotomizarse para convertirlas
en cualitativas con dos nicas categoras, por ejemplo, el rendimiento categorizado como
alto o bajo.

Ordinales: Si sus valores se pueden ordenar pero no hay la misma distancia entre las
diferentes categoras de la variable, es decir, permiten establecer relaciones de mayor,
menor o igual. Por ejemplo el grado de satisfaccin Intensidad del dolor (leve, moderado,
intenso), las notas (suspenso, aprobado, notable, sobresaliente), etc.

B) Cuantitativas o Numricas: son variables que pueden ser medidas de forma numrica y, por
tanto, sus valores corresponden a cantidades y tiene sentido hacer operaciones algebraicas con
ellos. Este grupo incluye variables:

Discretas: si toma nicamente valores enteros: n de hijos, edad (n de aos), notas (de 0
a 10), etc.

Continuas: Si entre dos valores, son posibles infinitos valores intermedios: altura, peso,
puntuaciones en test estandarizados, presin intraocular, etc.

Otra forma de clasificacin de variables es segn el papel o funcin que desempea en una
investigacin. Desde esta perspectiva es posible diferenciar entre:

Independientes: es una variable que funciona como un estmulo para provocar cambios.
Tambin se suele identificar con el agente o con la posible causa de que otras variables
cambien o varen. Por ejemplo, si la hiptesis es: los estudiantes que reciben un programa
de mejora de la creatividad obtienen mejores resultados en comprensin lectora que
aquellos que siguen la enseanza tradicional, es recibir o no el programa de creatividad la
variable que antecede a los resultados en comprensin lectora y, por tanto, ser la variable
independiente que, en este caso, tiene dos valores: mtodo de creatividad o enseanza
tradicional.

Dependientes: es la variable dnde se observan los cambios producidos por la variable


independiente y es el objeto de inters de la investigacin. En los estudios con variable
neuropsicolgicas y rendimiento acadmico, las primeras anteceden a los resultados de
rendimiento. Por ejemplo, el tratamiento (causa o variable independiente) provoca cambios
en el rendimiento de los estudiantes (efecto o variable dependiente). En esta distincin
conviene destacar que es el investigador quien decide el papel de las variables cuando
formula las hiptesis.

Intervinientes: son variables que afectan a la dependiente, pero que no producen


cambios que interesen para la investigacin. Son variables ajenas a la investigacin pero
que pueden afectar a los resultados. Si se incluyen en el diseo se denominan variables de
control y si no se incluyen variables extraas.

Tambin conviene tener en cuenta que cuando se estudia nicamente la relacin entre variables
mediante coeficientes de correlacin, no se diferencia entre dependiente e independiente porque
un coeficiente de correlacin no indica que variable antecede a otra o cul es la causa.
Finalmente, las variables independientes tambin reciben una doble categorizacin: Son
variables activas si el investigador puede manipular de forma directa, es decir, es el investigador
4

Enrique Navarro Asencio (@eduktive)

quien decide qu niveles o modalidades tiene esa variable y permite distribuir a los sujetos de
forma aleatoria en esos niveles, como diferentes dosis de medicamento o diferentes modalidades de
un programa de intervencin (control, experimental). En cambio, son variables asignadas si no
pueden ser manipuladas por el investigador, es decir, son caractersticas propias de los sujetos
como el gnero, nivel educativo, edad, etc.

1.2 FORMULACIN DE HIPTESIS ESTADSTICAS


El anlisis estadstico inferencial se lleva a cabo para probar algn tipo de hiptesis, ya sea para
encontrar diferencias entre grupos, probar la relacin entre variables, o anlisis ms complejos
como la prediccin (regresin) o la causalidad (anlisis de ecuaciones estructurales). En todos los
casos se debe formular una hiptesis que se confirmar (o no), en funcin de los resultados de estos
anlisis.
Una hiptesis es una afirmacin sobre un posible resultado que el investigador espera encontrar en
su investigacin y el contraste de hiptesis (tambin denominado prueba de significacin o prueba
estadstica) es el mtodo que se utiliza para averiguar si esa hiptesis debe aceptarse o rechazarse.
La lgica del contraste de hiptesis estadstico consiste en aceptar o rechazar la hiptesis
formulada en trminos de probabilidad de ocurrencia, es decir, una hiptesis se rechaza porque
tienen poca probabilidad de que se produzca. De lo que se trata es de probar con datos empricos
esa hiptesis y comprobar si el resultado se puede generalizar a la poblacin.
Las hiptesis de una investigacin neuropsicolgica suelen referirse a correlaciones entre
variables o a comparaciones de grupo, aunque existen otro tipo de hiptesis (de prediccin, de
causalidad, etc.). Por ejemplo, un investigador formula la siguiente hiptesis de investigacin:
No existen diferencias entre las puntuaciones de creatividad de chicos y chicas
El investigador quiere comprobar si los resultados en creatividad de los chicos y las chicas son
estadsticamente iguales. Esta hiptesis para ser contrastada en primer lugar se formula en
trminos estadsticos.
Una hiptesis estadstica es una afirmacin sobre las caractersticas de una distribucin de
probabilidad y surge de la hiptesis de investigacin formulada. Siguiendo con el ejemplo anterior
y considerando que la creatividad se ha medido en una escala de intervalo, el investigador quiere
probar si las medias de chicos y chicas son iguales.
La hiptesis de investigacin es el origen de las hiptesis estadsticas, pero no son exactamente lo
mismo. Mientras que la hiptesis de investigacin hace referencia a algn aspecto observado de la
realidad, las estadsticas hacen referencia a la distribucin de probabilidad que, en este caso, como
se cuenta con una variable cuantitativa (distribucin normal), se formula sobre la distribucin de la
media:
Mediachicos= Mediachicas
Las hiptesis estadsticas son siempre 2: Nula (representada por H0) y alternativa (representada p
La hiptesis nula es siempre la hiptesis que se somete a contraste y siempre se formula en
trminos de igualdad cuando se comparan los resultados de dos o ms grupos o de negacin
cuando se trata de correlacin, es decir, indica que no hay correlacin entre variables o que el valor
de la correlacin es igual a cero. En cambio la hiptesis alternativa incluye el resto de resultados
posible que no se establecen en la nula.
Las hiptesis estadsticas se formulan de esta manera para que rechazar la hiptesis nula suponga
automticamente la confirmacin de la alternativa, Ambas son complementarias y mutuamente
excluyentes. Por ejemplo, en el caso de buscar la relacin entre dos variables la hiptesis nula (H0)
quedara formulada de la siguiente forma:
5

Enrique Navarro Asencio (@eduktive)

No existe relacin entre el rendimiento en matemticas y el rendimiento en lengua (o la


correlacin entre las variables es igual a cero).
H0: = 0

Y la hiptesis alternativa (H1) sera as:

Las variables rendimiento en matemticas y rendimiento en lengua estn relacionadas.


H1: 0

Para el caso en el que la hiptesis trata de analizar las diferencias entre grupos de sujetos distintos,
por ejemplo, diferencias en matemticas en funcin del gnero, quedara formulada de la siguiente
forma:

Hiptesis Nula (H0): No existen diferencias en el rendimiento en matemticas de


mujeres y hombres (o las puntuaciones de hombres y mujeres son iguales).
H0: chicos= chicas

Hiptesis Alterna (H1): S existen diferencias en el rendimiento en matemticas de


mujeres y hombres (o las puntuaciones de hombres y mujeres son diferentes).
H1: chicos chicas

Mediante el anlisis estadstico adecuado se busca evidencia para aceptar o rechazar la hiptesis
nula. En caso de ser rechazada, la hiptesis alternativa debe aceptarse.

1.3 DISTRIBUCIN MUESTRAL


Para definir una variable aleatoria se deben determinar los diferentes valores que puede tomar y
con qu probabilidad pueden ocurrir esos valores. Cada valor de una variable tiene una
probabilidad de ocurrencia, de la misma forma que cuando lanzamos una moneda al aire sabemos
que existe un 50% de probabilidades de que salga cara y otro 50% de que salga cruz. A esa funcin
de probabilidad se la denomina distribucin muestra o densidad de probabilidad.
Las probabilidades de ocurrencia de los niveles de una variable son equivalentes a sus frecuencias
relativas o porcentajes, es decir, cuntas veces ocurre un fenmeno del total de casos.
En las variables con dos nicos niveles, como el lanzamiento de una moneda o el gnero de los
sujetos, acertar o fallar un tem, etc. los niveles pueden tener o no la misma probabilidad de
ocurrencia, este tipo de distribuciones se denominan distribuciones binomiales
1
0,75
50%

50%

0,5
0,25
0

5000 LANZAMIENTOS

FIGURA 3. DISTRIBUCIN BINOMIAL CON IGUAL PROBABILIDAD

Enrique Navarro Asencio (@eduktive)

Cuando se trabaja con variables cuantitativas y se cuenta con un tamao suficiente, su distribucin
muestral adquiere forma de campana de Gauss que se denomina distribucin normal o tambin
conocida como distribucin Z.

68,28%
95%
99%

-2,58

-1,96

-1

+1

+1,96

+2,58

FIGURA 4. DISTRIBUCIN NORMAL

Con esta distribucin es posible saber exactamente cul es la probabilidad de que un sujeto obtenga
un valor determinado en la variable y tambin que habr ms probabilidades de que se obtengan
valores prximos a la media que los valores extremos, es decir, un mayor nmero de casos se
situar en esos valores cercanos a la media y habr menos casos en los valores extremos. Y conocer
adems cuntos casos hay entre dos valores de la variable, por ejemplo, hay un 50% de casos a un
lado y otro de la media (en la distribucin normal media, mediana y moda tienen el mismo valor),
entre la puntuacin de -1,96 y la de +1,96 se encuentran el 95% de los sujetos.
El valor representativo o esperado de las variables cuantitativas, es decir, el valor que tiene una
mayor probabilidad de ocurrencia, es la media. Y en consecuencia, cuando se contrastan
hiptesis con variables cuantitativas se utiliza ese estadstico como referencia: la
media. Por ejemplo, una de las posibles hiptesis que podra comprobarse es si las chicas y los
chicos difieren en sus resultados de creatividad y, para averiguarlo, se compararan los resultados
medios de ambos grupos para comprobar esas diferencias.
La media tiene su distribucin muestral que se asemeja a la curva normal, pero no es el nico tipo
de distribucin existente. Cuando se trabaja con variables cualitativas nominales se comparan las
frecuencias o proporciones, si se emplean variables ordinales se analizan rangos, etc. Incluso
cuando se calcula una correlacin, tambin cuenta con una distribucin muestral asociada a los
valores obtenidos. Otras distribuciones conocidas son la binomial, F de Senedor, chi-cuadrado, T
de Student, etc.
Por tanto, cuando contrastamos hiptesis utilizando muestras es necesario comparar esos valores
con los de la distribucin para confirmar que ese resultado se producira tambin en la poblacin. Y
contar con un tipo de variables u otras determinar la distribucin muestral de referencia.

1.4 ESTADSTICOS DE CONTRASTE Y PROBABILIDAD ASOCIADA


Los estadsticos son esas distribuciones que se utilizan como referencia para contrastar las
hiptesis formuladas. En esta gua se describen aquellos que tienen el objetivo de, por un lado,
encontrar diferencias entre dos o ms grupos y, por otro, analizar la relacin entre distintas
variables.
7

Enrique Navarro Asencio (@eduktive)

Utilizar variables cuantitativas que cumplen con los requisitos de normalidad, como ya se
mencion en el tema anterior, es uno de los supuestos que se deben cumplir para utilizar pruebas
estadsticas paramtricas. En cambio, si la distribucin de puntuaciones no cumple con la
normalidad se debern emplear pruebas no paramtricas.

Pruebas Paramtricas: se utilizan con variables cuantitativas y con una muestra


suficiente de sujetos (al menos 30 casos por grupo). Estos requisitos son necesarios para
obtener una distribucin normal de las puntuaciones en la variable analizada.
Pruebas NO Paramtricas: se utilizan con variables dependientes cualitativas, ya
sean ordinales o nominales. Tambin cuando se cuenta con variables cuantitativas pero
no se alcanza el tamao mnimo recomendado.

La decisin de emplear un tipo de pruebas u otras depende de las caractersticas de las variables
que forman parte de la investigacin. Para utilizar pruebas paramtricas las variables deben
cumplir una serie de supuestos:

Variables dependientes cuantitativas: medidas en escalas de intervalo o razn. En


algunas ocasiones variables ordinales pueden considerarse cuantitativas si cumplen con
el supuesto de normalidad
Normalidad de las puntuaciones: las variables objeto de estudio deben tener
distribucin normal, es decir, con forma de campana de Gauss. Este supuesto puede
comprobarse con la prueba de Kolmogorov-Smirnov, pero si se cuenta con variables
cuantitativas y un tamao muestral suficiente (30 casos).

FIGURA 5. DISTRIBUCIN NORMAL DE PUNTUACIONES

Homocedasticidad: cuando se comparan las puntuaciones de dos o ms grupos es


necesario que la varianza de esos grupos sea homognea, es decir, que las varianzas de
los grupos sean iguales 1. Es posible comprobar este supuesto con la prueba de Levene o
de Box. Tambin es necesario garantizar un tamao suficiente de los grupos (30 casos
por grupo a comparar).
Independencia de las observaciones: en la recogida de informacin, las respuestas
de un sujeto a un determinado test no deben depender de las respuestas de otro sujeto.
Linealidad: para el estudio de correlacin con pruebas paramtricas (ndice de
Pearson) es necesario que la relacin entre el par de variables analizadas sea lineal.

Por tanto, adems del tipo de hiptesis a contrastar (relacin o diferencias entre grupos), es la
naturaleza de las variables (cuantitativa o cualitativa) y el tamao muestral, los que determinan la
prueba estadstica adecuada para analizar la informacin. En funcin de esa naturaleza, los
estadsticos se clasifican dentro de esas dos categoras generales:
A. Estadsticos Paramtricos
1. Diferencias entre grupos: T de Student y F de Snedecor (ANOVA)

Conviene recordad que la varianza es un estadstico descriptivo de dispersin

Enrique Navarro Asencio (@eduktive)

2. Correlacin: Pearson
B. No Paramtricos
1. Diferencias entre grupos: U de Mann-Whitney, H de Kruskal-Wallys y W de
Wilcoxon
2. Correlacin: Spearman, Tau b, Tau c, Gamma y Chi-cuadrado, biserial-puntual
El estadstico siempre va acompaado de un valor de probabilidad asociado. Normalmente se
nombra como sig. (bilateral) o P-valor. Este valor es el que determina si el estadstico calculado ha
resultado significativo.

NIVEL DE SIGNIFICACIN
Cada estadstico estimado en un contraste de hiptesis, ya sea paramtrico o no paramtrico, de
correlacin o comparacin, siempre se acompaa de su probabilidad de ocurrencia de la hiptesis
nula (p-valor).
Esta probabilidad asociada al estadstico indica el nmero de ocasiones (cuntas veces de cada 100,
es una proporcin) que se cumplir la hiptesis nula. Ese valor se debe comparar con un valor de
probabilidad, elegido por el investigador, que establece el lmite para considerar que una hiptesis
se cumple. Ese valor de comparacin es el nivel de significacin o nivel de error que se espera
cometer () y en investigacin social no debe superar el 5%, es decir, una probabilidad de 0,05.
Para aceptar la hiptesis nula deber cumplirse ms del 5% de las ocasiones, por tanto, debe tener
una probabilidad asociada que supere el 0,05.
Unos valores bajos de probabilidad asociada al estadstico inferior o igual al nivel de error (5% o
inferior o igual a 0,05) sealarn que la hiptesis nula no se cumple el nmero suficiente de
ocasiones y, en consecuencia, deber rechazarse y, por tanto, aceptar la hiptesis alternativa. En
cambio, si la probabilidad supera ese valor deber aceptarse.
Ese 5% (=,05) es el lmite establecido por consenso en investigacin. No obstante, si el resultado
de la probabilidad es igual o inferior al 1% (p = ,01) indica que la hiptesis nula solo ocurre una de
cada 100 veces. Si esa probabilidad es del 0,1% (p= ,001) nos indica que ocurre una de cada 1000
ocasiones. Cuanto ms bajo sea el nivel de significacin ms seguridad habr al rechazar la
hiptesis nula.
Siempre que se realiza un contraste de hiptesis estadstico hay cierta probabilidad de error. Ese
5% indica tambin el error que se asume en el contraste de hiptesis. Utilizar este punto de corte
del valor de la probabilidad conlleva asumir un 95% de nivel de confianza, pero es posible aunque
poco probable que rechacemos una hiptesis nula cuando es cierta, o que la aceptemos cuando es
falta. Los distintos tipos de error que pueden cometerse se resumen en la siguiente tabla:
Realidad
H0 cierta

H0 Falsa

No Rechazo H0

Correcto
El tratamiento no tiene efecto y
as se decide.
Robustez estadstica

Error de tipo II
El tratamiento si tiene efecto
pero no lo percibimos.
Probabilidad

Rechazo H0
Acepto H1

Error de tipo I
El tratamiento no tiene efecto
pero se decide que s.
Probabilidad

Correcto
El tratamiento tiene efecto y el
experimento lo confirma.
Potencia estadstica

Tabla 1. Tipos de error en un contraste de hiptesis

Enrique Navarro Asencio (@eduktive)

Por tanto, cuando se rechaza la hiptesis nula es porque tiene poca probabilidad de ocurrencia. En
un anlisis de correlacin la hiptesis nula se formula en trminos de negacin de la relacin entre
las variables de rendimiento. Y, por tanto, la obtencin de un valor de probabilidad inferior a 0,05
quiere decir que esa falta de relacin, la hiptesis nula, ocurre menos del 5% de las veces y debe ser
rechazada. En el otro 95% de los casos la relacin es significativa. De forma opuesta, cuando el
valor de probabilidad supera ese 0,05 la hiptesis nula tiene una probabilidad de ocurrencia
suficiente para no ser rechazada.

1.5 CLASIFICACIN DE ANLISIS ESTADSTICOS PARA EL CONTRASTE


DE HIPTESIS.
En este apartado se presentan los estadsticos ms habituales para contrastar hiptesis de
correlacin o de comparacin de grupos, diferenciando entre paramtricos y no paramtricos.
Los distintos anlisis de correlacin que se incluyen en esta gua estn representados en la Figura
6. El coeficiente Pearson se emplea con variables cuantitativas y tamaos muestrales grandes (por
encima de 30 casos). El coeficiente Spearman (tambin tau-b, tau-c y gamma) se emplean cuando
no se alcanza ese tamao muestral o cuando las variables analizadas tienen naturaleza ordinal.
Cuando se correlaciona una variable cualitativa dicotmica y otra cuantitativa se utiliza la
correlacin biserial-puntual. Finalmente, el coeficiente chi-cuadrado analiza la relacin entre
variables cualitativas nominales o entre una variable nominal y otra ordinal.
El estadstico chi-cuadrado tiene variantes en funcin del nmero de niveles de la variable
nominal. Si las variables tienen el mismo nmero de categoras, especialmente si las variables a
correlacionar tienen dos nicas categoras, se utiliza el coeficiente de contingencia. En cambio, si el
nmero de niveles es distinto se empleara chi-cuadrado.

Paramtrica

Variables Cuantitativas
(Pearson)

Cualitativas Ordinales

Descriptiva Bivariada

(Spearman, taub,
tauc, gamma)

(Correlacin)

No Paramtrica

Nominal dicotmica y
cuantitativa (biserialpuntual)
chi-cuadrado, phi y v
de Cramer (distinto
nmero de categoras)
Cualitativas Nominales
Coeficiente de
contingencia, phi y v
de Cramer (mismo
nmero de categoras

Figura 6. Clasificacin de anlisis de correlacin

Las pruebas estadsticas para la comparacin de grupos, adems de la distincin entre


paramtricas y no paramtricas, tambin pueden variar en funcin del nmero de grupos a
comparar y si esos grupos estn relacionados o son independientes, como muestra la Figura 7 y
Figura 8.

10

Enrique Navarro Asencio (@eduktive)

T de Student para
una muestra

1 grupo

Independientes
(T de Student)

Paramtrica

2 grupos

Relacionados
(T de Student)

Independientes
(ANOVA)

Ms de dos grupos

Relacionados
(ANOVA de medidas
repetidas)

Figura 7. Pruebas paramtricas para la comparacin de grupos

1 grupo

VD. Ordinal o
Nominal (ChiCuadrado como
bondad de ajuste)
VD. Ordinal
(U de MannWhitney)
Independientes
VD. Nominal
(Chi-cuadrado para
la independencia)

2 grupos

VD y VI
dicotmicas
(Coeficiente de
Contingencia)

VD. Ordinal (W de
Wilcoxon)

No Paramtrica

Relacionados
Variables
dicotmicas
(Mc Nemar)

VD. Ordinal (H de
Kruskal Wallis)
Independientes
VD Nominal
(Chi-cuadrado para
la independencia)
Ms de dos grupos

VD. Ordinal
(Q de Cochran)
Relacionados
VD y VI nominal
(Friedman)

Figura 8. Pruebas No Paramtricas para la comparacin de grupos

11

Enrique Navarro Asencio (@eduktive)

Todas las pruebas paramtricas y no paramtricas se describen en esta gua excepto aquellas que se
utilizan para comparar ms de dos grupos relacionados (ANOVA de medidas repetidas, Friedman y
Q de Cochran). Se excluyen debido a su alta complejidad de interpretacin y porque son poco
utilizadas en este campo de estudio. Las pruebas para grupos relacionados, tanto paramtricas
como no paramtricas, normalmente comparan nicamente dos grupos: un pretest con un postest.

GRUPOS RELACIONADOS VS. GRUPOS INDEPENDIENTES


La diferencia principal entre estos dos tipos de grupos son las caractersticas de los sujetos que los
componen. En los grupos independientes los sujetos tienen caractersticas distintas y las
comparaciones se llevan a cabo utilizando esas variables distintivas. Por ejemplo, comparar los
resultados en funcin del gnero (chicos y chicas), en funcin de su nivel de rendimiento (altobajo), de su lateralidad, etc. En cambio, en los grupos relacionados se compara a los mismos
sujetos en momentos temporales distintos. El ejemplo ms claro de grupos relacionados es cuando
se mide a los mismos casos en dos ocasiones distintas (pretest-postest), pero tambin es posible
formar grupos relacionados emparejando a los sujetos en funcin de alguna caracterstica, por
ejemplo, que tengan el mismo nivel de razonamiento espacial (ver Figura 10).
Supongamos que queremos comprobar el efecto de un programa de enseanza de las matemticas.
Para ello, formamos dos grupos uno va a recibir el programa y el otro no. Existen dos posibilidades
de construir estos grupos.
La primera de ellas se muestra la Figura 9, y distribuye a los sujetos de forma aleatoria en los dos
grupos. Si se acta de esta manera es posible que los grupos no sean equivalentes, es decir, que
tengan alguna caracterstica diferente y que influya en los resultados de matemticas, por ejemplo,
el razonamiento espacial. En este caso, esa variable es distinta entre los grupos y puede afectar a los
resultados de matemticas, independientemente del tratamiento experimental que se aplica.

Figura 9. Grupos Independientes

Para evitar este problema se mide inicialmente a los sujetos en razonamiento verbal y se
distribuyen en los grupos en funcin de sus niveles. Cada grupo cuenta con un individuo de cada
nivel de razonamiento verbal, estn emparejados (ver Figura 10) y los grupos son equivalentes,
estn relacionados. De esta forma, la media en razonamiento verbal es igual en ambos grupos y no
afectar a los resultados de matemticas.

12

Enrique Navarro Asencio (@eduktive)

Figura 10. Grupos relacionados en funcin de su Razonamiento Espacial

La otra opcin, ya mencionada, para forma grupos relacionados es la utilizacin de los mismo
sujetos en varias ocasiones de medida, es decir, la comparacin de los resultados de un pretest con
un postest.

1.6 SOFTWARE PARA EL CONTRASTE DE HIPTESIS Y ANLISIS DE


DATOS.
Para llevar a cabo el anlisis de la informacin con la finalidad de contrastar hiptesis estadsticas,
van a utilizarse dos herramientas informticas:

EZAnalyze: es un complemento gratuito de Microsoft Excel. Permite realizar anlisis


descriptivo de las variables y las pruebas paramtricas de contraste de hiptesis. Puede
conseguirse en la siguiente pgina web: http://www.ezanalyze.com

SPSS: es un paquete estadstico para el anlisis de datos. No es una herramienta gratuita


pero es posible conseguir una versin por 15 das en la siguiente direccin:
https://www14.software.ibm.com/download/data/web/en_US/trialprograms/W110742E0
6714B29.html. Con este software puede realizarse cualquier tipo de anlisis estadstico pero
en esta gua se emplea para la estadstica no Paramtrica.

PSPP: alternativa gratuita a SPSS. Es posible hacer los anlisis estadsticos ms habituales
en investigacin. La desventaja es que los grficos no son editables. Hay versiones para
Windows
(http://pspp.awardspace.com/),
Mac
(http://lavergne.gotdns.org/projects/pspp/) y Linux (http://mirrors.nfsi.pt/gnu/pspp/)

13

Enrique Navarro Asencio (@eduktive)

2. PRUEBAS ESTADSTICAS (PARAMTRICAS Y NO


PARAMTRICAS)
Como ya se ha mencionado, las pruebas paramtricas se emplean cuando la variable dependiente
analizada sigue una distribucin normal. Normalidad estadstica quiere decir que la distribucin de
frecuencias de esa variable tiene la forma de campana de Gauss.
Este tipo de distribucin tiene un mayor nmero de caso en torno a los valores medios o centrales y
un menor nmero en los extremos de la distribucin.
Para cumplir con los requisitos de normalidad las variables deben ser cuantitativas. Normalmente,
las puntuaciones de test estandarizados cumplen con ese requisito. No obstante, en ocasiones
cuando se cuenta con poca muestra (inferior a 30 casos) las variables cuantitativas tampoco
cumplen ese supuesto de normalidad.
Por tanto, cuando se cuenta con poca muestra y tambin cuando la variable dependiente es
cualitativa, deben aplicarse pruebas estadsticas no paramtricas para el anlisis de los datos.

2.1 PRUEBAS PARAMTRICAS DE DIFERENCIAS ENTRE GRUPOS


El objetivo de este tipo de pruebas es encontrar diferencias estadsticamente significativas entre las
puntuaciones de una variable cuantitativa (variable dependiente) de varias muestras o grupos
(variable independiente). Es una prueba de comparacin y permite obtener la respuesta a la
cuestin existen diferencias entre las puntuaciones medias de los grupos? Veamos un ejemplo:
La hiptesis nula que se prueba con este tipo de anlisis es la siguiente:

NO existen diferencias significativas en las puntuaciones de la variable inteligencia


emocional (variable dependiente) en funcin de la variable gnero (variable independiente,
la que forma los grupos)

Tambin se puede formular de la siguiente forma:

Las puntuaciones de la variable inteligencia emocional de los chicos es igual a la de las


chicas

Conviene recordar, que toda hiptesis nula tiene una hiptesis alternativa en el caso de que sea
rechazada. En este caso:

S existen diferencias significativas en las puntuaciones de la variable inteligencia


emocional (variable dependiente) en funcin de la variable gnero (variable independiente,
la que forma los grupos).

El tipo de prueba estadstica podr variar en funcin del nmero de grupos a comparar, en el
ejemplo anterior la variable gnero tiene dos nicos grupos (mujer-hombre). Y tambin en funcin
de si los grupos son relacionados o independientes.

2.1.1 DIFERENCIAS ENTRE LAS PUNTUACIONES DE DOS GRUPOS


INDEPENDIENTES. PRUEBA T DE STUDENT
La variable independiente debe tener nicamente dos categoras independientes. Es decir, solo
pueden compararse dos grupos distintos y sus niveles o categoras deben ser mutuamente
excluyentes. Por ejemplo, el gnero (hombre-mujer), rendimiento categorizado (alto-bajo),
14

Enrique Navarro Asencio (@eduktive)

lateralidad (izquierda-derecha), asistencia a preescolar (S-No), recibir un tratamiento o programa


experimental (grupo experimental-grupo control), etc.
El estadstico adecuado para analizar las diferencias entre las medias de dos grupos es T de
Student. Su objetivo es analizar las diferencias entre las medias de dos grupos en una variable
dependiente con distribucin normal. Por ejemplo, diferencias entre chicas y chicos en el
rendimiento en matemticas.
Supongamos que se desean analizar las diferencias entre varones y mujeres en las puntuaciones de
una prueba que mide el conocimiento de otras culturas y religiones. Las hiptesis quedaran
formuladas de la siguiente manera:

Hiptesis Nula: No existen diferencias estadsticamente significativas en el nivel de


conocimientos de otras culturas en funcin del gnero (Mujer-Varn) de los participantes.

Hiptesis Alterna: S existen diferencias estadsticamente significativas en el nivel de


conocimientos de otras culturas en funcin del gnero (Mujer-Varn) de los participantes.

Los resultados proporcionados por el complemento de Excel para el anlisis de datos EZAnalyze
aparecen en la Tabla 2 y la Figura 11
La primera parte de los resultados muestra los estadsticos descriptivos (media, desviacin tpica y
tamao de los grupos (N)) para cada grupo. En este caso el grupo uno son las mujeres y el dos los
varones. Se observa que la media de las mujeres (7,750) es mayor a la de los varones (4,385).
Para conocer si esas diferencias entre las medias de ambos grupos, que muestran los estadsticos
descriptivos, son significativas debe observarse la probabilidad asociada al estadstico T, es decir,
su probabilidad de ocurrencia. En la tabla aparece con la letra P y su valor es de 0,000.
Como el valor de la probabilidad asociada al estadstio T es inferior al nivel de error (0,05) debe
rechazarse la hiptesis nula y aceptar la alternativa. Es decir, se confirman las diferencias en las
puntuaciones medias de mujeres y varones en el nivel de conocimientos de otras culturas.
La tabla tambin informa sobre la diferencia entre las medias de los dos grupos (mean difference).
En este caso hay 3,365 puntos de diferencia a favor de las mujeres. Por tanto, las mujeres tienen un
mayor conocimiento de otras culturas que los varones.
EZAnalyze Results Report - Independent T-Test of group 1 and 2 on INFORMA
SEXO
Mean:
Std. Dev:
N:

1 (Mujeres)
7,750
1,212
48

2 (Varones)
4,385
2,180
52

Mean Difference:
3,365
Probabilidad
T-Score:
9,434
asociada
Eta Squared:
,471
P:
,000
The observed difference between the group means is significant
Tabla 2. Prueba T de diferencias entre dos grupos. Resultados EZAnalyze

La tabla de resultados se acompaa de un grfico de barras que representa las puntuaciones


medias de los dos grupos comparados (ver la Figura 11)

15

Enrique Navarro Asencio (@eduktive)

Figura 11. Medias de los grupos.

2.1.2 DIFERENCIAS ENTRE LAS PUNTUACIONES DE TRES O MS GRUPOS


INDEPENDIENTES. ANLISIS DE VARIANZA (ANOVA)
Cuando la variable independiente tiene ms de dos grupos, por ejemplo, el nivel socioeconmico
(alto-medio-bajo) el tipo de prueba debe adaptarse a estas caractersticas.
El estadstico que se calcula en el ANOVA es F d Snedecor. Esta prueba estadstica es similar a
la prueba T pero compara las medias de tres o ms grupos. El estadstico F, de la misma forma que
en pasaba con T de Student, va acompaado de una probabilidad asociada que determina si las
diferencias entre los grupos son significativas.
La manera de llevar a cabo la interpretacin y tomar la decisin de aceptacin o rechazo de la
hiptesis nula es igual que con las pruebas anteriores. Cuando el valor de esa probabilidad asociada
al estadstico, en esta caso F de Snedecor, es inferior a 0,05, la hiptesis nula deber rechazarse y se
podr confirmar las diferencias entre los grupos. Si el valor supera ese 0,05 la hiptesis nula deber
aceptarse. Esto quiere decir que las puntuaciones de los grupos son tienen medias iguales.
Esta prueba tambin se acompaa de los denominados contrastes posteriores (post hoc) que
determinan entre qu grupos se dan esas diferencias.
Por ejemplo, si el objetivo es analizar las diferencias en las puntuaciones obtenidas en un test de
xenofobia en funcin de los contactos con otras culturas (es una variable con tres grupos 1. Nulos,
2. Sistemticos, 3. Ocasionales), las hiptesis quedaran formuladas de la siguiente forma:

Hiptesis Nula: No existen diferencias estadsticamente significativas en el nivel


xenofobia en funcin del tipo de contacto con otras culturas (Nulo-Sistemtico-Ocasional).

Hiptesis Alterna: S existen diferencias estadsticamente significativas en el nivel


xenofobia en funcin del tipo de contacto con otras culturas (Nulo-Sistemtico-Ocasional).

Los resultados que arroja el programa EZAnalyze se muestran en la Tabla 3, Tabla 4 y Figura 12.
En la primera de ellas (Tabla 3) aparecen los estadsticos descriptivos de cada grupo (media,
desviacin tpica y tamao de los grupos) y tambin una media global de xenofobia (grand mean).
Se observa que la media global es de 35 puntos aproximadamente. Si se analizan los grupos por
separado, el grupo 2 (contactos sistemticos) obtienen la menor puntuacin media en xenofobia
con un valor de 30 puntos. El grupo con contacto nulo (grupo 1) tiene menor media (35,459) que
los que tienen un contacto ocasional (grupo3).
16

Enrique Navarro Asencio (@eduktive)

Esta misma tabla se muestra tambin los resultados del ANOVA. Para comprobar si existen
diferencias entre los grupos se observa el valor de la probabilidad asociada al estadstico F de
Snedecor (P). Esta probabilidad tiene un valor de 0,001, valor inferior a 0,05. Como la
probabilidad de ocurrencia de la hiptesis nula es muy baja debe ser rechazada y, por tanto,
aceptar la alternativa y afirmar diferencias entre los grupos.
EZAnalyze ANOVA Report - ANOVA of AXENOFO by CONTACT
0 cases were removed due to missing data
Grand Mean
N

35,050
100

CONTACT(group)
1
2
3

N
37
32
31

Group Mean
35,459
30,000
39,774

Std Deviation
9,873
9,333
10,459

Source of Variance
Between Groups
Within Groups
Total

ANOVA Table
SS
1514,141
9490,609
11004,750

DF
2,000
97,000

MS
757,071
97,841

F
7,738

P
,001
Eta Squared
,138
The ANOVA results indicate that at least two of the groups differed significantly
Tabla 3. Prueba F de Snedecor (ANOVA)

Como en este caso se cuenta con ms de dos grupos, la prueba F de Snedecor no informa entre qu
grupos se producen las diferencias. Para averiguarlo debe observarse la tabla de contrastes
posteriores (Tabla 4). En esta tabla se comparan las diferencias entre cada grupo por separado, es
decir, el grupo 1 con el grupo 2, el grupo 1 con el grupo 3 y el grupo 2 con el grupo 3.
La forma de interpretar los contrastes posteriores es igual que la de cualquier otro contraste de
hiptesis. En realidad, no son ms que pruebas T de Student para cada par de grupos observados.
Debe observarse por tanto, la probabilidad asociada a ese estadstico T (P-Unadjusted). Si ese valor
es inferior a 0,05, las diferencias entre las puntuaciones de los dos grupos son significativas.
En este ejemplo se han encontrado diferencias significativas entre los grupos 1 y 2 y entre los
grupos 2 y 3. En cambio, las diferencias no son estadsticamente significativas entre los grupos 1 y
3. Esta tabla tambin ofrece informacin sobre el valor exacto de esa diferencia de medias en la
columna mean difference
Post Hoc tests
Group_1

Comparison

Mean Difference

T-Value

P - Unadjusted

P - Bonferroni

Eta Squared

1 and 2
1 and 3

5,459
4,315

2,349
1,747

,022
,085

,065
,256

,076
,044

2 and 3

9,774

3,917

,000

,001

,201

Group_2

Tabla 4. Contrastes posteriores (post hoc)

Finalmente los resultados se acompaan de un grfico de barras que muestra las medias en
xenofobia de los tres grupos comparados (Figura 12).

17

Enrique Navarro Asencio (@eduktive)

Figura 12. Medias de los grupos

2.1.3 DIFERENCIAS ENTRE LAS PUNTUACIONES DE DOS GRUPOS RELACIONADOS.


PRUEBA T DE STUDENT
Cuando se comparan las puntuaciones de los mismos sujetos en una variable determinada pero en
dos momentos temporales distintos (pretest y postest) o cuando los grupos estn equiparados en
funcin de alguna caracterstica de los sujetos, por ejemplo, que los niveles medios de inteligencia
sean iguales en los grupos a comparar, es necesario aplicar una prueba estadstica adecuada a estas
caractersticas. La prueba idnea en este caso es T de Student para grupos relacionados.
El nombre de la prueba es el mismo que en el caso de los grupos independientes, pero la forma de
calcular el estadstico vara ligeramente. No obstante, ese cambio en el clculo no afecta a la
manera de interpretar los resultados.
Por ejemplo, si el objetivo es conocer si la aplicacin de un programa de educacin intercultural
mejora los conocimientos sobre otras culturas y religiones, las hiptesis quedaran formuladas de
la siguiente forma:

Hiptesis Nula: No existen diferencias estadsticamente significativas en el nivel de


conocimientos sobre otras culturas antes y despus del programa.
o

Otra posibilidad es: No existen diferencias estadsticamente significativas entre el


pretest y postest de la variable conocimientos sobre otras culturas y religiones.

Hiptesis Alterna: S existen diferencias estadsticamente significativas en el nivel de


conocimientos sobre otras culturas antes y despus del programa.
o

Otra posibilidad es: S existen diferencias estadsticamente significativas entre el


pretest y postest de la variable conocimientos sobre otras culturas y religiones.

Los resultados de la prueba T para grupos relacionados aparecen en la Tabla 5 y Figura 13. La
informacin que incluye esta tabla es similar al resto de contrastes. En primer lugar, las medias y
desviaciones tpicas de las puntuaciones en el pretest y en el postest. Puede comprobarse que la
puntuacin es ms alta en el postest (11,690).
De la misma forma que en los casos anteriores, para verificar si esas diferencias entre pretest y
postest son estadsticamente significativas debe observarse el valor de probabilidad asociado al
estadstico, es decir, P. Al estar por debajo de 0,05, concretamente es igual 0,000, la hiptesis nula
tiene poca probabilidad de ocurrencia y debe rechazarse. Por tanto, las diferencias entre pretest y
18

Enrique Navarro Asencio (@eduktive)

postest son significativas, siendo ms altas en el postest. Esto quiere decir que el programa de
educacin intercultural ha mejorado el nivel de conocimientos sobre otras culturas y religiones.
EZAnalyze Results Report - Paired T-Test of INFORMA2 with INFORMA3
Mean:
Std. Dev.:

INFORMA2 (pretest)
8,850
2,409

INFORMA3 (postest)
11,690
2,770

N Pairs:
100
Mean Difference:
-2,840
SE of Diff.:
,208
Eta Squared:
,650
T-Score:
13,636
P:
,000
The difference between INFORMA2 and INFORMA3 is significant
Tabla 5. Resultados prueba T para dos grupos relacionados

Los resultados se acompaan de un grfico de barras que plasma las medias de las puntuaciones
pretest y postest.

Figura 13. Grfico de medias pretest y postest

2.1.4 COMPARACIN DE UN NICO GRUPO. PRUEBA T DE STUDENT


Tambin existe la posibilidad de comparar los resultados obtenidos por la muestra en una variable
determinada, por ejemplo, inteligencia, con una puntuacin de esa variable que sirva como
referente. Esta puntuacin de referencia es un dato conocido, es decir, se ha encontrado en algn
trabajo de investigacin con caractersticas similares, es el dato de la poblacin, etc.
Si el investigador pretende averiguar si la media en nivel de vocabulario de los sujetos de la
muestra difiere de los resultados obtenidos en otra investigacin o en la poblacin de referencia.
Por ejemplo, trata de confirmar que la media de su muestran en nivel vocabulario es igual a la de la
poblacin, que fue igual a 15. Por tanto, las hiptesis se formularan de la siguiente manera:

Hiptesis Nula: No existen diferencias estadsticamente significativas en el nivel de


vocabulario de la muestra y un nivel de vocabulario igual 15.
19

Enrique Navarro Asencio (@eduktive)

Hiptesis Alterna: S No existen diferencias estadsticamente significativas en el nivel de


vocabulario de la muestra y un nivel de vocabulario igual 15.

Los resultados de esta prueba se presentan mediante una tabla y un grfico (Tabla 6 y Error! No se
encuentra el origen de la referencia.). La tabla incluye los estadsticos descriptivos de la muestra en la
variable objeto de estudio (nivel de vocabulario). Incluye la media (16,583), la desviacin tpica
(6,344) y el nmero de sujetos (36). El valor de la columna NTV es el valor de comparacin, en este
caso, una media de 15 puntos en nivel de vocabulario.
Para confirmar que las dos medias son distintas se debe poner atencin en el valor de T (T-score) y
su probabilidad asociada (P). Una probabilidad inferior a 0,05 indica que las diferencias son
estadsticamente significativas. Pero no ocurre as, el valor de probabilidad es 0,143 y supera, por
tanto, el 0,05.
EZAnalyze Results Report - One Sample T-Test

N Valid:
N Missing:
Mean:

Nivel de vocabulario previo (030)


36
0
16,583

Std. Dev:

6,344

Mean Diff:
T-Score:
Eta
Squared:
P:

1,583
1,497
,060

NTV

15,00
0

,143
Tabla 6 y Figura 14. Resultados prueba T para una muestra.

Se debe aceptar por tanto la hiptesis nula formulada. No es posible afirmar la existencia de
diferencias estadsticamente significativas entre las dos medias comparadas.

2.2 PRUEBAS PARAMTRICAS DE RELACIN ENTRE VARIABLES


El anlisis de correlacin se utiliza con el objetivo estudiar la relacin entre dos variables. En este
tipo de anlisis no se diferencia entre variable dependiente e independiente, ambas tienen el
mismo papel.
La hiptesis nula que se pone a prueba en este anlisis es la siguiente:

Las variables (nombres de las variables) analizadas no estn relacionadas.

Y, por tanto, la hiptesis alternativa es la que afirma la existencia de relacin entre las variables:

Las variables (nombres de las variables) analizadas s estn relacionadas.

De la misma forma que en los anlisis de diferencias entre grupos, el tipo de prueba estadstica
depender de las caractersticas de las variables analizadas y del tamao muestral. Cuando las dos
variables correlacionadas son cuantitativas y se cuenta con al menos 30 casos, el estadstico
adecuado es la correlacin de Pearson.

2.2.1 CORRELACIN ENTRE DOS VARIABLES CUANTITATIVAS. PEARSON


20

Enrique Navarro Asencio (@eduktive)

Este estadstico puede tomar valores entre -1 y +1. El cero quiere decir ausencia de correlacin. A
medida que el valor se acerca a los extremos (-1 o +1) la correlacin es ms potente. El signo seala
la direccionalidad de la correlacin. Un valor negativo quiere decir que a medida que aumentan los
valores de una variable disminuyen los de la otra (correlacin inversa). En cambio, si el valor es
positivo, a medida que aumentan unos tambin lo hacen los otros y viceversa (correlacin directa).
Por ejemplo, si se seleccionan 30 individuos y se mide su peso y altura. Utilizando estas dos
variables como referencia es posible elaborar un grfico de dispersin como el siguiente (Figura
15):

Figura 15. Grfico de dispersin con las variables peso y altura

Este grfico representa con un punto a cada uno de los sujetos estudiados. Este punto representa
su altura y peso concretos y observando su forma de agrupacin es posible averiguar la existencia
de cierta tendencia en los datos, como se muestra en el Figura 16.

Figura 16. Grfico de dispersin con lnea de tendencia.

21

Enrique Navarro Asencio (@eduktive)

A simple vista puede observarse una relacin directa entre las variables peso y altura, es decir, a
media que la altura es mayor tambin lo es el peso. Aunque los grficos de dispersin permiten
observar el sentido de la relacin (ver Figura 17), para conocer el grado exacto de la relacin es
necesario calcular un ndice de correlacin.

Figura 17. Tipos de relacin entre variables

En la Tabla 7 aparecen los resultados de un anlisis de correlacin de Pearson entre las


puntuaciones de una escala de xenofobia y las de otra escala de dogmatismo, ambas son variables
cuantitativas. Las hiptesis correspondientes son:

Hiptesis Nula: Las variables xenofobia y dogmatismo NO estn relacionadas.

Hiptesis Alternativa: Las variables xenofobia y dogmatismo S estn relacionadas.


EZAnalyze Results Report - Correlation of AXENOFO with DOGMAT
Pearson Correlation
N
P

,500
100,000
,000

The observed correlation is statistically significant


Tabla 7. Correlacin de Pearson entre xenofobia y dogmatismo

El valor de la correlacin entre las dos variables analizadas es de 0,5. Es por tanto un valor de
relacin positivo y con intensidad media. La correlacin se complementa con la probabilidad
asociada al estadstico (P), que en este caso es de 0,000. De la misma forma que en los contrastes
de medias, es necesario que esta probabilidad asociada se encuentre por debajo de 0,05 para
concluir que el valor de la correlacin es significativo. En caso de que la probabilidad supere el 0,05
la correlacin no sera significativa, independientemente del valor del coeficiente de Pearson.

22

Enrique Navarro Asencio (@eduktive)

Figura 18. Grfico de dispersin entre xenofobia y dogmatismo

La tabla de correlacin se acompaa del grfico de dispersin (Figura 18) de las dos variables
analizadas. En este grfico puede observarse la tendencia de la relacin. En este caso positiva y
media.

2.3 PRUEBAS NO PARAMTRICAS DE DIFERENCIAS ENTRE GRUPOS


A continuacin se describen las pruebas estadsticas para la comparacin de grupos cuando las
variables dependientes analizadas no son cuantitativas o cuando el nmero de casos de la muestra
no alcanza los 30. Cada prueba no Paramtrica tiene su equivalente no Paramtrica.

2.3.1 DIFERENCIAS ENTRE LAS PUNTUACIONES DE DOS GRUPOS


INDEPENDIENTES. PRUEBA U DE MANN-WHITNEY.
Cuando la variable dependiente no es cuantitativa y tiene un carcter ordinal o no se cuenta con
variables con una distribucin normal, hay un estadstico equivalente a T de Student denominado
U de Mann Whitney. Tambin se utiliza cuando el tamao de los grupos es reducido (inferior o
igual a 30 casos), aunque se cuente con variables dependientes cuantitativas. Su funcin es la
misma que la prueba T pero en lugar de comparar las medias de los grupos compara rangos.
Los rangos son una transformacin de las puntuaciones de la variable analizada para poder llevar a
cabo ese anlisis no paramtrico. La interpretacin es similar a una media, un mayor rango indica
valores mayores en los resultados de ese grupo.

23

Enrique Navarro Asencio (@eduktive)

Figura 19. Proceso de transformacin de puntuacin a rango

Uno de los casos en los que se aplica este tipo de prueba es cuando los dos grupos a comparar
tienen menos de 30 casos. A continuacin se incluye un ejemplo concreto.
El objetivo es comparar los resultados en la variable comprensin lectora en funcin de s los
estudiantes han asistido o no a educacin preescolar. La variable comprensin lectora es una
variable cuantitativa obtenida a partir de un test, pero slo se cuenta con 16 sujetos que han
asistido a preescolar y 18 que no.
Las hiptesis a contrastar son las siguientes:

Hiptesis Nula: No existen diferencias estadsticamente significativas en el nivel lectora


en funcin de la asistencia o no a educacin preescolar.

Hiptesis Alternativa: S existen diferencias estadsticamente significativas en el nivel


lectora en funcin de la asistencia o no a educacin preescolar.

Los resultados del anlisis se presentan en dos tablas distintas (Tabla 8 y Tabla 9). La primera de
ellas muestra los resultados descriptivos para los dos grupos analizados. Es posible identificar el
rango promedio en la variable comprensin lectora de ambos grupos. En este caso, los estudiantes
que si asistieron a preescolar obtienen un mayor rango en compresin lectora (22,56), frente al 13
obtenido por los que no asisten. Como ya se ha mencionado un mayor rango equivale a una mayor
puntuacin en esa variable. No obstante, para conocer si esas diferencias iniciales son significativas
debe observarse la Tabla 9.
Asistencia a Preescolar N Mean Rank Sum of Ranks
Comprensin lectora (0-30) S
16
22,56
361,00
No
18
13,00
234,00
Total
34
Tabla 8. Rangos. Prueba U

El rechazo o aceptacin de la hiptesis nula depende del valor del estadstico calculado, en esta
caso U, y su probabilidad asociada. De la misma forma que el resto de pruebas estadstica, para que
los resultados sean significativos, es decir, rechazar la hiptesis nula y afirmar la diferencia entre
las puntuaciones de la variable dependiente, el valor de esa probabilidad debe ser inferior a 0,05.
24

Enrique Navarro Asencio (@eduktive)

Esto ndica que la hiptesis nula planteada tiene pocas probabilidades de ocurrencia y, por tanto,
debe ser rechazada.
Comprensin lectora (0-30)
Mann-Whitney U
63,000
Wilcoxon W
234,000
Z
-2,799
Asymp. Sig. (2-tailed)
,005
a. Not corrected for ties.
Tabla 9. Prueba U de Mann-Whitney

En este caso se pueden afirmar diferencias en la variable dependiente (comprensin lectora) entre
los grupos. El valor de la probabilidad asociada es igual a 0,005, inferior al 0,05 que se utiliza como
margen de error.
Para conocer qu grupo ha obtenido mayores puntuaciones en la variable dependiente debe
observarse la tabla de rangos. Un mayor rango ndica que ese grupo obtiene mayores puntuaciones
en la variable dependiente.

2.3.2 DIFERENCIAS ENTRE LAS PUNTUACIONES DE TRES O MS GRUPOS


INDEPENDIENTES. PRUEBA H DE KRUSKAL-WALLYS
El equivalente no paramtrico del ANOVA es la prueba H de Kruskal-Wallis que tiene una lgica
similar a la prueba U de Mann-Whitney. En lugar de medias se analizan los rangos de los grupos.
La forma de interpretar los resultados es la misma que en los casos anteriores. Valores de
probabilidad asociados al estadstico de H de Kruskal-Wallis inferiores a 0,05 indican diferencias
entre los rangos y, por tanto, diferencias en las puntuaciones de los grupos.
Las hiptesis a contrastar son las siguientes:

Hiptesis Nula: No existen diferencias estadsticamente significativas en el nivel lectora


en funcin del nivel socioeconmico (alto-medio-bajo)

Hiptesis Alternativa: S existen diferencias estadsticamente significativas en el nivel


lectora en funcin del nivel socioeconmico (alto-medio-bajo)

En este caso se cuenta con tres grupos de comparacin pero los resultados son los mismos que se
obtienen con la prueba U de Mann-Whitney. Una primera tabla de rangos que describe las
puntuaciones medias de los tres grupos (Tabla 10) y otra para los resultados concretos del contraste
de hiptesis (Tabla 11).
Nivel socioeconmico N Mean Rank
Comprensin lectora (0-30)Alto
12 23,00
Medio
12 18,83
Bajo
12 13,67
Total
36
Tabla 10. Rangos. Prueba H

Se aplica la prueba no Paramtrica porque los grupos a comparar nicamente cuentan con 12 casos
cada uno. En la tabla anterior se observa que el grupo de nivel socioeconmico alto es el que mayor
rango promedio obtiene, con un valor de 23.
Para comprobar si las diferencias encontradas en la tabla de rangos son estadsticamente
significativas, se debe observar la Tabla 11.
25

Enrique Navarro Asencio (@eduktive)

Test Statisticsa
Comprensin lectora (0-30)
Chi-Square
4,738
df
2
Asymp. Sig.
,094
a. Kruskal Wallis Test
Tabla 11. Prueba H de Kruskal Wallis

Aunque en la tabla aparezca el estadstico Chi-square (chi-cuadrado), el estadstico utilizado es H


de Kruskal Wallis. Chi-cuadrado es solo una transformacin porque H no tiene distribucin de
probabilidad conocida y, por ese motivo, se transforma en chi para poder asignar esos valores de
probabilidad.
En este caso la probabilidad asociada al estadstico H es de 0,094. Valor que supera el 0,05
establecido como lmite. Por tanto, no se pueden asumir diferencias estadsticamente significativas
entre los grupos comparados. Debe aceptarse la hiptesis nula.

2.3.3 DIFERENCIAS ENTRE LAS PUNTUACIONES DE DOS GRUPOS RELACIONADOS.


PRUEBA W DE WILCOXON.
En el caso de contar con dos grupos relacionados, como las puntuaciones pretest y postest de un
mismo estudiante, pero no se cumplen los requisitos para aplicar pruebas paramtricas o las
variables analizadas son ordinales, la prueba W de Wilcoxon es el equivalente no paramtrico.
La prueba de Wilcoxon, de la misma forma que las pruebas no paramtricas U de Mann-Whitney y
H de Kruskal Wallis tambin utiliza rangos en lugar de medias para llevar a cabo la comparacin.
Las hiptesis a contrastar son las siguientes:

Hiptesis Nula: No existen diferencias estadsticamente significativas entre el pretest y


postest de la variable nivel de vocabulario recodificada (alto-medio-bajo)

Hiptesis Alternativa: S existen diferencias estadsticamente significativas entre el


pretest y postest de la variable nivel de vocabulario recodificada (alto-medio-bajo)

Los resultados del contraste aparecen en dos tablas (Tabla 12 y Tabla 13). En la primera se
muestran los rangos diferenciados en tres categoras. En primer lugar los rangos negativos que
indican los casos en los que la puntuacin del pretest es mayor que la del postest; en segundo lugar,
los rangos positivos que indican cuando la puntuacin del postest es mayor a la del pretest; y,
finalmente, los empates.
En este ejemplo hay 0 rangos negativos, 3 positivos y 33 empates. Por tanto, en ningn caso la
puntuacin del pretest es mayor que la del postest; en 3 casos ocurre al revs, es mayor el postest; y
en la mayora de los casos (33) se obtiene la misma puntuacin en el pretest y en el postest.

Nivel de Vocabulario (postest) - Nivel de


Vocabulario (pretest)

Rangos Negativosa
Rangos Positivosb
Empatesc
Total

N
0a
3b
33c
36

Media de
Rangos
,00
2,00

Suma de
Rangos
,00
6,00

26

Enrique Navarro Asencio (@eduktive)

Nivel de Vocabulario (postest) - Nivel de


Vocabulario (pretest)

N
0a
3b
33c
36

Rangos Negativosa
Rangos Positivosb
Empatesc
Total
a. Nivel de Vocabulario (postest) < Nivel de Vocabulario (pretest)
b. Nivel de Vocabulario (postest) > Nivel de Vocabulario (pretest)
c. Nivel de Vocabulario (postest) = Nivel de Vocabulario (pretest)
Tabla 12. Rangos. Prueba W de Wilcoxon

Media de
Rangos
,00
2,00

Suma de
Rangos
,00
6,00

Es necesario analizar la Tabla 13 para comprobar la existencia de diferencias estadsticamente


significativas entre pretest y postest.
Test Statisticsb
Nivel de Vocabulario
(postest) - Nivel de
Vocabulario (pretest)
Z
-1,732a
Asymp. Sig. (2-tailed)
,083
a. Basado en rangos negativos.
b. Wilcoxon Signed Ranks Test
Tabla 13. Prueba W de Wilcoxon

El valor de probabilidad asociada al estadstico calculado es de 0,083, valor que se encuentra por
encima de 0,05. Por tanto, debe aceptarse la hiptesis nula y no se pueden afirmar diferencias
entre las puntuaciones de pretest y postest.

2.3.4 DIFERENCIAS ENTRE LAS PUNTUACIONES DE DOS GRUPOS RELACIONADOS.


PRUEBA MCNEMAR
Cuando se comparan dos grupos relacionados y la variable dependiente es cualitativa con dos
nicas categoras el estadstico adecuado es McNemar. Esta prueba equivale a la comparacin de
dos proporciones de casos de la misma variable en dos momentos temporales distintos, por
ejemplo, si hay el mismo nmero de casos que aprueben la asignatura de matemticas en la
primera y en la segunda evaluacin.
Las hiptesis a contrastar son las siguientes:

Hiptesis Nula: No existen diferencias estadsticamente significativas entre el nmero de


casos que supera el pretest y los que superan el postest de la variable nivel de vocabulario
recodificada (No supera-Supera)

Hiptesis Alternativa: S existen diferencias estadsticamente significativas entre el


nmero de casos que supera el pretest y los que superan el postest de la variable nivel de
vocabulario recodificada (No supera-Supera)

Los resultados del contraste aparecen en dos tablas (Tabla 14 y Tabla 15). La primera es una tabla
de contingencia que analiza el nmero de casos que hay en las distintas categoras de las variables
(cuntos casos no superan el pretest y postest; cuntos no superan el pretest y s el postest; cuntos
casos superan el pretest y el postest; cuntos casos superan el pretest, pero no el postest). La
segunda tabla indica si los cambios entre pretest y postest son significativos.
Tabla de contingencia VOCA_Pre * VOCA_Post

27

Enrique Navarro Asencio (@eduktive)

VOCA_Pr No
Recuento
e
Supera % dentro de COM2
Supera Recuento
% dentro de COM2
Total
Recuento
% dentro de COM2
Tabla 14. Tabla

VOCA_Post
No Supera Supera
10
7
58,8%
41,2%
5
8
38,5%
61,5%
15
15
50,0%
50,0%
de contingencia

Total
17
100,0%
13
100,0%
30
100,0%

Para comprobar si los cambios entre pretest y postest son estadsticamente significativos debe
observarse la siguiente tabla:
Pruebas de chi-cuadrado
Sig. exacta
Valor
(bilateral)
Prueba de McNemar
,774a
N de casos vlidos
30
a. Utilizada la distribucin binomial
Tabla 15. Prueba de mcnemar

El resultado de la prueba indica que la probabilidad asociada al estadstico (o,774) supera al nivel
de error asumido (0,05) y, por tanto, debe aceptarse la hiptesis nula y afirmar que no hay un
mayor nmero de casos que supere la prueba de vocabulario en el postest que en el pretest.

2.3.5 COMPARACIN DE UN NICO GRUPO. CHI-CUADRADO COMO BONDAD DE


AJUSTE.
Esta prueba de comparacin se utiliza cuando el objetivo es comprobar si el nmero de casos que
hay en cada categora (frecuencias observadas) de una variable cualitativa es el mismo (frecuencia
esperada).
Esta frecuencia esperada es el nmero de sujetos que se esperaba obtener en cada categora de la
variable. Puede ser el mismo nmero en cada categora o un nmero concreto establecido por el
investigador.
Por ejemplo, quiere comprobarse si el nmero de sujetos de cada categora de la variable Madurez
Lectora es el mismo, es decir, si el mismo nmero de sujetos obtiene una madurez lectora baja,
media y alta. Las hiptesis a contrastar son las siguientes:

Hiptesis Nula: No existen diferencias estadsticamente significativas en las frecuencias


(n de casos) de cada categora de la variable Madurez Lectora.

Hiptesis Alternativa: S existen diferencias estadsticamente significativas en las


frecuencias (n de casos) de cada categora de la variable Madurez Lectora.

Los resultados de esta prueba se presentan en dos tablas (Tabla 16 y Tabla 17). En la primera
aparecen las frecuencias observadas (Observed N) que es el n de sujetos en cada categora de la
variable analizada, por ejemplo, hay 9 casos con madurez lectora baja y 19 con media; las
frecuencias esperadas (Expected N) si las categoras tuvieran el mismo n de casos, 12 casos en
cada categora; y el residual que es la diferencia entre las observadas y las esperadas. La segunda
tabla incluye los resultados del estadstico chi-cuadrado y su probabilidad asociada:
Observed N Expected N Residual

28

Enrique Navarro Asencio (@eduktive)

Baja

12,0

-3,0

19

12,0

7,0

Alta

12,0

-4,0

Total

36

Media

Tabla 16. Frecuencias observadas y esperadas de la variable Madurez Lectora (categorizada)

Es necesario observar la probabilidad asociada al estadstico chi-cuadrado (Tabla 17) para


confirmar la existencia de diferencias entre las frecuencias observadas y las esperadas.

Categorizacin Madurez Lectora


Chi-Square
6,167a
df
2
Asymp. Sig.
,046
a. 0 celdas (,0%) tienen una frecuencia esperada
inferior 5. La frecuencia minima esperada es 12,0.
Tabla 17. Prueba chi-cuadrado como bondad de ajuste.

En este ejemplo, la probabilidad asociada al estadstico chi-cuadrado es de 0,046, valor inferior a


0,05. Por tanto, debe rechazarse la hiptesis nula y confirmar que el nmero de casos de cada
categora no es el mismo en la variable madurez lectora.

2.4 PRUEBAS NO PARAMTRICAS DE RELACIONES ENTRE VARIABLES


El objetivo del anlisis de correlacin no paramtrico es el mismo que persigue el anlisis
paramtrico: cuantificar la relacin existente entre dos variables. Las hiptesis, por tanto,
coinciden con las formuladas en el anlisis de correlacin paramtrico

Hiptesis nula: Las variables (nombres de las variables) analizadas no estn


relacionadas.

Hiptesis alternativa: Las variables (nombres de las variables) analizadas s estn


relacionadas.

El tipo de estadstico de correlacin adecuado depender de las caractersticas de las variables


analizadas. Cuando las dos variables correlacionadas estn medidas a nivel de intervalo y siguen
una distribucin normal el estadstico adecuado es la correlacin de Pearson (ver apartado 2.2.1).
No obstante, contar con poca muestra o con variables de otra naturaleza son aspectos que
determinan el estadstico de correlacin. Adems de Pearson, otros tipos de coeficientes de
correlacin no paramtricos son los siguientes:

Rho de Spearman: se utiliza cuando las variables tienen naturaleza cualitativa ordinal o
tambin con variables cuantitativas pero con muestras pequeas (menos de 30 casos).
Otras alternativas a este coeficiente son Tau b y Tau c y gamma.

Chi-cuadrado: se utiliza cuando se analiza la relacin entre dos variables cualitativas


nominales. Por ejemplo, la relacin entre sexo (hombre-mujer) y rendimiento (alto-bajo).
Tambin se utiliza para relacionar una variable nominal y otra ordinal.

29

Enrique Navarro Asencio (@eduktive)

2.4.1 CORRELACIN ENTRE DOS VARIABLES CUALITATIVAS ORDINALES.


SPEARMAN, TAU-B, TAU-C Y GAMMA
La correlacin de Spearman se utiliza cuando las variables tienen naturaleza cualitativa ordinal.
Tambin cuando las variables son cuantitativas pero se cuenta con poca muestra. El ejemplo
clsico de variables ordinales son los tems de un cuestionario de opinin: valora de 1 a 5 tu grado
de acuerdo con las siguientes afirmaciones (variables tipo Likert).
La interpretacin es idntica a la correlacin paramtrica. Tau b y Tau c de Kendall y Gamma son
una alternativa al coeficiente de correlacin de Spearman.
La interpretacin de estos coeficientes de correlacin no paramtricos (Spearman, tau b, tau c y
gamma) es idntica a la de Pearson. Sus valores oscilan entre -1 y +1. Recordemos que el valor cero
quiere decir ausencia de correlacin. A medida que el valor se acerca a los extremos (-1 o +1) la
correlacin es ms potente. El signo seala la direccionalidad de la correlacin. Un valor negativo
quiere decir que a medida que aumentan los valores de una variable disminuyen los de la otra
(correlacin inversa). En cambio, si el valor es positivo, a medida que aumentan unos tambin lo
hacen los otros y viceversa (correlacin directa).
Veamos un ejemplo. Se quiere analizar la relacin entre dos variables ordinales. Son Madurez
lectora y nivel de vocabulario que inicialmente eran variables cuantitativas y se han recodificado en
tres categoras: baja-media-alta. Las hiptesis a contrastar son las siguientes:

Hiptesis nula: Las variables madurez lectora y nivel de vocabulario, ambas con tres
categoras (baja-media-alta) no estn relacionadas.

Hiptesis alternativa: Las variables madurez lectora y nivel de vocabulario, ambas con
tres categoras (baja-media-alta) S estn relacionadas.

A modo de ejemplo, se han calculado los cuatro coeficientes posibles entre variables ordinales. En
la prctica nicamente se necesita uno de ellos. El ms utilizado es Spearman (Tabla 18).

Spearman's
rho

Categorizacin Madurez
Lectora

Categorizacin
Madurez Lectora
1,000

Categorizacin Nivel de
Vocabulario
,916**

Correlation
Coefficient
Sig. (2-tailed)
.
N
36
Categorizacin Nivel de Correlation
,916**
Vocabulario
Coefficient
Sig. (2-tailed)
,000 .
N
36
**. Correlation is significant at the 0.01 level (2-tailed).
Tabla 18. Correlacin de Spearman entre Madurez lectora y nivel de vocabulario categorizadas.

,000
36
1,000

36

De la misma forma que en el resto de contraste de hiptesis, debe observarse el valor del
coeficiente, junto con el valor de la probabilidad asociada. Si ese valor es inferior a 0,05 el valor de
la correlacin es significativo. En caso contrario no se podr confirmar la relacin entre las
variables estudiadas.
En este caso, el coeficiente de Spearman es igual a 0,916 y la probabilidad asociada al estadstico
(sig. (2-tailed) es 0,000, valor inferior a 0,05. Por tanto, la correlacin es significativa.
El programa SPSS marca con un asterisco (*) las correlaciones que son significativas considerando
un nivel de error de 0,05 y con dos (**) las que lo son con 0,01, es decir, con un nivel de confianza
del 95% o del 99%
30

Enrique Navarro Asencio (@eduktive)

En la tabla de resultados (Tabla 18) aparecen dos coeficientes de correlacin porque es una tabla
simtrica. Incluye los valores de correlacin entre madurez lectora y nivel de vocabulario y tambin
entre nivel de vocabulario y madurez lectora.
El resto de coeficientes de correlacin para variables ordinales (Tabla 19) muestran valores muy
similares:
Asymp. Std.
Value
Error
Approx. T Approx. Sig.
Ordinal by Ordinal Kendall's tau-b
,902
,051
8,947
,000
Kendall's tau-c
,813
,091
8,947
,000
Gamma
1,000
,000
8,947
,000
N of Valid Cases
36
Tabla 19. Correlacin tau-b, tau-c y gamma entre Madurez lectora y nivel de vocabulario categorizadas.

Todos los coeficientes resultan significativos. Los valores de probabilidad asociada (Approx. Sig.)
son inferiores a 0,05. Un anlisis en profundidad de cada uno de ellos indican que tau-b es el que
obtiene un valor ms parecido a Spearman (Tau-b= 0,902 y Spearman= 0,916). El coeficiente
Gamma indica una correlacin perfecta entre las variables, con un valor de 1. En cambio, tau-c es el
ms conservador de los tres, con un valor de 0,813. No obstante, las diferencias entre coeficientes
son mnimas. En todos los casos la intensidad de la correlacin es alta.

2.4.2 CORRELACIN ENTRE DOS VARIABLES CUALITATIVAS NOMINALES. CHICUADRADO PARA LA INDEPENDENCIA
Finalmente, el coeficiente de correlacin chi-cuadrado se utiliza cuando las variables analizadas
tienen naturaleza cualitativa (por ejemplo, lateralidad (izquierda-derecha) o sexo (mujer-varn),
etc.). Tambin se emplea cuando se correlaciona una variable cualitativa nominal con otra ordinal.
El coeficiente chi-cuadrado se interpreta de forma distinta al resto de coeficientes de correlacin
porque no hay valores negativos.
En los coeficientes de Pearson, Spearman, tau-b, tau-c y gamma los valores oscilan entre -1 y +1. En
el caso de chi-cuadrado nicamente puede indicarse si la correlacin es significativa o no, en
funcin de la probabilidad asociada. Si es inferior a 0,05 ser una relacin significativa.
nicamente pueden compararse coeficientes chi-cuadrado entre s y, en ese caso, un mayor valor
quiere decir una relacin ms potente entre las variables.
Las hiptesis a contrastar son las siguientes:

Hiptesis nula: Las variables asistencia a preescolar y nivel de vocabulario categorizada


(baja-media-alta) son independientes (o no estn relacionadas).

Hiptesis alternativa: Las variables asistencia a preescolar y nivel de vocabulario


categorizada (baja-media-alta) estn relacionadas.

Los resultados se distribuyen en dos tablas. La primera (Tabla 20) es una tabla de contingencia que
muestra el nmero de sujetos con los que cuenta cada una de las categoras de las variables. O ms
bien, del cruce de categoras de las dos variables analizadas.
En este ejemplo, cuntos alumnos han asistido a preescolar y tienen un nivel de vocabulario bajo (1
caso), cuntos medio (9 casos) y cuntos un nivel alto (6 casos). La tabla tambin proporciona la
misma informacin para los que no han asistido a preescolar, 6 casos tienen un nivel de
vocabulario bajo, 11 medio y 1 alto.

31

Enrique Navarro Asencio (@eduktive)

Analizando la tabla de contingencia se observa cierta tendencia. Hay un mayor nmero de casos
con nivel de vocabulario alto y que han asistido a preescolar. En cambio, los que no han asistido a
preescolar tienen un mayor nmero de casos con nivel de vocabulario bajo.
Categorizacin Nivel de Vocabulario
Baja
Media
Alta
Total
Asistencia a Preescolar S
1
9
6
16
No
6
11
1
18
Total
7
20
7
34
Tabla 20. Tabla de contingencia de Asistencia a preescolar y nivel de vocabulario

Los resultados tambin incluyen un grfico de barras (Figura 20) con la misma informacin que la
tabla de contingencia:

Figura 20. Grafico de barras desagregado

Para confirmar est relacin debe observarse la tabla de chi-cuadrado (Tabla 21). Este coeficiente
no analiza rangos, estudia el nmero de casos de casos de cada categora y su posible tendencia. En
la tabla aparecen varios coeficientes pero debe observare nicamente chi-cuadrado (chi-square).
La manera de conocer si el estadstico chi-cuadrado ha resultado significativo es la misma que en el
resto de contrastes de hiptesis. Valores de probabilidad (Asymp. Sig. (2-sided)) inferiores a 0,05
indican que la relacin ha resultado significativa. Por tanto, las dos variables cualitativas
estudiadas estn correlacionadas.
En este ejemplo la probabilidad asociada a chi-cuadrado es de 0,027, un valor inferior al 0,05. Por
tanto, las variables asistencia a preescolar y nivel de vocabulario estn relacionadas. No es posible
conocer la intensidad de la relacin a no ser que se compare con otros coeficientes chi-cuadrado.
Chi-cuadrado no tiene intervalos establecidos como el coeficiente de correlacin de Pearson que
oscila entre -1 y +1. En ese caso, un mayor de chi indica mayor intensidad de la relacin entre
variables.

Pearson Chi-Square
Likelihood Ratio

Value
7,250a
8,007

df

Asymp. Sig. (2sided)


2
,027
2
,018

32

Enrique Navarro Asencio (@eduktive)

Linear-by-Linear
6,957
1
,008
Association
N of Valid Cases
34
a. 4 cells (66,7%) have expected count less than 5. The minimum
expected count is 3,29.
Tabla 21. Prueba Chi-cuadrado

Hay una adaptacin del coeficiente de correlacin chi-cuadrado que se utiliza cuando las dos
variables cualitativas analizadas tienen el mismo nmero de categoras. Por ejemplo, si tratamos de
relacionar el gnero (Mujer-Hombre) con la variable sociabilidad (alta sociabilidad-baja
sociabilidad). Es el coeficiente de contingencia
Los resultados tambin se presentan en dos tablas. La primera es una tabla de contingencia (Tabla
22) que representa las frecuencias de cada categora obtenida con el cruce de las dos variables. En
este caso: mujeres con alta sociabilidad, mujeres con baja sociabilidad, varones con alta
sociabilidad y varones con baja sociabilidad. La segunda (Tabla 23) muestra los resultados
concretos del coeficiente de contingencia y su probabilidad asociada.
Extroversin y sociabilidad
Alta sociabilidad Baja sociabilidad Total
SEXO Mujer
30
18
48
Varn
25
27
52
Total
55
45 100
Tabla 22. Tabla de contingencia de sexo y sociabilidad

Los valores del coeficiente de contingencia oscilan entre 0 y 1. Valores cercanos a 1 indican una
relacin muy potente entre las variables y cercanos a 0 indican ausencia de relacin. No es posible
diferenciar entre relacin directa o inversa. No obstante, para que el coeficiente resulte significativo
el valor de la probabilidad asociada debe ser inferior a 0,05.
Value Approx. Sig.
Nominal by Nominal Contingency Coefficient ,143
,148
N of Valid Cases
100
Tabla 23. Coeficiente de Contingencia.

En este ejemplo, el valor del coeficiente de contingencia es 0,143 y la probabilidad asociada es igual
a 0,148. Este valor de probabilidad es superior a 0,05 y, por tanto, la relacin entre las variables
sexo y sociabilidad no resulta significativa.

2.4.2 CORRELACIN ENTRE UNA VARIABLE CUALITATIVA NOMINAL DICOTMICA


Y UNA VARIABLE CUANTITATIVA
Cuando contamos con una variable cualitativa con dos categoras (dicotmica), por ejemplo,
acertar o fallar un tem, ser fumador o no fumador, superar o no superar una prueba, etc. y se
pretende correlacionar con las puntuaciones de una variable cuantitativa. En este caso, la
correlacin adecuada es la biserial-puntual.
Este estadstico de correlacin es un caso particular de Pearson que se aplica cuando una de las
variables tiene valores de 0 y 1.
Sus resultados se interpretan de la misma forma que Pearson. El estadstico puede tomar valores
entre -1 y +1 y el cero quiere decir ausencia de correlacin. A medida que el valor se acerca a los
extremos (-1 o +1) la correlacin es ms potente y el signo seala la direccionalidad de la
correlacin.
33

You might also like