You are on page 1of 7

Sexta clase:

Bioestadstica Aplicada I
n Mtodos paramtricos y no
paramtricos

n Medias, varianza y correlacin


NMRCD Programa GEIS
UPCH FASPA n Pruebas para variables continuas
ABE Per

Bioestadstica Aplicada

Porqu usamos pruebas no Cmo se aplican estas pruebas:


paramtricas?: n Aplicar una transformacin a los datos originales,
convertindolos en rangos, valores positivo o
Porque no siempre se cumplen todos los negativo, etc.
supuestos requeridos por las pruebas de
hiptesis tradicionales (paramtricas): n Con los datos transformados, calcular un
Distribucin normal
n estadstico en base a los datos (a veces tambin
se calcula su promedio y error estndar)
n Tamao de muestra grande

n Varianzas iguales (?) n Con el estadstico y los parmetros calculados,


Si la distribucion de la poblacion es sesgada realizar una prueba de hiptesis de acuerdo a
(Por lo que la media no es buen indicador de una cierta distribucin paramtrica (Normal, Ji-
cuadrado, Binomial, etc.)
tendencia central)
Bioestadstica Aplicada Bioestadstica Aplicada

Ejemplo:
Transformaciones de datos
Si trabajamos con parasitemia, con
frecuencia tendremos que aplicar una
n Si los datos tienen una distribucin transformacin
sesgada, en ocasiones pueden
transformarse para eliminar los sesgos

n En algunos casos se puede emplear un


test paramtrico despus de la
transformacin Log

Bioestadstica Aplicada Bioestadstica Aplicada

1
Anlisis con variables numricas:
Comando gladder:
Anlisis Paramtrico No paramtrico
Describir un grupo , 2 Mediana, rango
intercuartil
Comparar un grupo T Student de una Prueba Wilcoxon
a un valor muestra
Comparar medias T Student de dos Mann-Whitney
en 2 grupos muestras
Comparar medias T Student Prueba Wilcoxon
en 2 grupos apareada
apareados
Comparar medias ANOVA Kruskal-Wallis
en 3 o mas grupos
Correlacin entre Pearson (lineal) Spearman
dos variables (monotnica)
Bioestadstica Aplicada Bioestadstica Aplicada

Comparacin de una muestra histogram p59, fraction


contra una constante
.2

n Se piensa que la edad de inicio del consumo


de cigarrillos es la adolescencia
.15
Fraction

n Puntualmente se plantea que el consumo se


.1

inicia a los 15 aos


.05

n Si la distribucin es sesgada o la muestra es


pequea, una prueba paramtrica sobre la
0

0 20 40 60
media puede ser poco relevante qu edad tena ud. cuando fum cigarrillos por primera vez?

Bioestadstica Aplicada Bioestadstica Aplicada

Aunque no es necesario, hagamos


Prueba T Student de una muestra la prueba no paramtrica:

Bioestadstica Aplicada Bioestadstica Aplicada

2
Comparacin entre dos muestras
Prueba signrank (Wilcoxon):
independientes
n Ho: Mediana de la diferencia = 0 n Se piensa que la edad de inicio del consumo
de cigarrillos vara entre varones y mujeres
p59 15 = 0 p59 = 0
n Si la distribucin es sesgada, una prueba
n Asume una distribucin uniforme paramtrica sobre la media puede ser poco
alrededor de cero relevante

n Compara puntajes esperados con n Si los tamaos de muestra son pequeos (n


observados < 30), el TLC no se cumplir y la prueba T
podra llevar a conclusiones errneas
Bioestadstica Aplicada Bioestadstica Aplicada

Prueba T Student (paramtrica): Igualdad de varianzas:


Ho: varones = mujeres Ha: varones mujeres

n La prueba T de Student de grupos


independientes difiere si las varianzas
difieren entre los grupos, debiendo
agregarse la opcin unequal

n Para evaluar si las varianzas son


comparables o no se utiliza el comando
sdtest

Bioestadstica Aplicada Bioestadstica Aplicada

Prueba de Varianzas (sdtest) T Student con varianzas


Ho: 2 varones = 2mujeres Ha: 2 varones 2mujeres diferentes:

Bioestadstica Aplicada Bioestadstica Aplicada

3
Prueba de Mann-Whitney: Qu son los puntajes correlativos?

qu edad tena ud. cuando fum cigarrillos por primera vez?


60
n Equivalente no paramtrico a una prueba de
hiptesis de promedios para dos muestras

40
n Determina si una variable tiene valores mas
altos en una poblacin que en otra. NO

20
COMPARA LOS PROMEDIOS!!!

n Util si el tamao de muestra es pequeo o la

0
distribucin es demasiado sesgada
Varones Mujeres
.5 1 1.5 2 2.5
inf_sexo

Bioestadstica Aplicada Bioestadstica Aplicada

Prueba de Mann-Whitney:
Ho: Fumarvarones = Fumarmujeres Ha: Fumarvarones Fumarmujeres Interpretacin

n Se estn comparando valores o la


distribucin, no los promedios

n Si en un grupo los puntajes observados


son mayores a los esperados, ese
grupo tiene mayores valores

Bioestadstica Aplicada Bioestadstica Aplicada

Comparacin de dos grupos Prueba T Student apareada:


apareados Ho: fumar = tomar Ha: fumar tomar
n Es una sola muestra, en verdad, en la que se
han medido dos valores

n Se puede calcular la diferencia entre los


valores y sera una prueba de una sola
muestra

n Qu comienza primero, alcohol o tabaco?

n Prueba no paramtrica til si es muestra


pequea o distribucin muy sesgada
Bioestadstica Aplicada Bioestadstica Aplicada

4
Prueba signrank (Wilcoxon): Anlisis de Varianza:
Prueba paramtrica para determinar si hay
diferencias en el promedio de una variable
cuantitativa (inicio fumar) entre tres o ms
poblaciones (estratos sociales ). Supuestos :
n Distribucin normal en todas las poblaciones (no
es necesario si el tamao de muestra es
grande)

n Varianzas comparables entre poblaciones

n Observaciones (muestras) independientes


Bioestadstica Aplicada Bioestadstica Aplicada

Comparacin de Varianzas: Las hiptesis:

n Se usa en el ANOVA para determinar si hay n Hiptesis nula, Ho:


diferencias entre promedios de varias X-inicioAlto = X-inicioMedio = X-inicioBajo
muestras

n Tambin se usa ANOVA en el anlisis de n Hiptesis alternativa, Ha:


regresin, siendo un caso particular del Existen diferencias en la edad de inicio
ANOVA
de fumar promedios de al menos dos
n Utiliza la prueba estadstica F
estratos sociales

Bioestadstica Aplicada Bioestadstica Aplicada

Prueba de Kruskal -Wallis:

n Extensin de la prueba de Mann-Whitney a


mas de dos poblaciones

n Equivalente no paramtrico del anlisis de


varianza

n TAMPOCO COMPARA PROMEDIOS:


determina si una poblacin tiene valores
diferentes ( mas altos o mas bajos) que las
otras poblaciones

Bioestadstica Aplicada Bioestadstica Aplicada

5
En Stata:
Los puntajes correlativos:
qu edad tena ud. cuando fum cigarrillos por primera vez?
0 20 40 60

.5 1 1.5 2 2.5 3 3.5


estrato social

Bioestadstica Aplicada Bioestadstica Aplicada

Determinando pares diferentes:


Correlacin r de Pearson

n Mide el grado de asociacin lineal entre dos


variables numricas

n -1 <= r <= 1, r = 0 indica independencia

n Se calcula en stata con el comando pwcorr

n Requiere muestras grandes, distribuciones


cruzadas no sesgadas

Bioestadstica Aplicada Bioestadstica Aplicada

scatter p59 p89


Las hiptesis:
60

n Hiptesis nula (Ho):


40

rfumar - tomar = 0
p59b

n Hiptesis alternativa (H a):


20

rfumar - tomar 0
0

0 10 20 30 40 50
p89b

Bioestadstica Aplicada Bioestadstica Aplicada

6
Correlacin de puntajes
Resultados: (Spearman):
n Equivalente no paramtrico a la prueba de
correlacin lineal de Pearson. Se aplica cuando
la correlacin no es lineal, la muestra es
pequea o existen valores muy extremos

n Determina si dos variables cuantitativa u


cualitativa-ordinal estn correlacionadas positiva
(una crece y la otra tambin) o negativamente
(una crece y la otra disminuye)

n Al igual que las pruebas de Mann-Whitney y


Kruskal-Wallis, tambin utiliza datos por rangos
Bioestadstica Aplicada Bioestadstica Aplicada

Las hiptesis: Resultados:

n Hiptesis nula, Ho:


?-puntajes fumar - tomar = 0

n Hiptesis alternativa, Ha:


?- puntajes fumar - tomar 0

Bioestadstica Aplicada Bioestadstica Aplicada

Que debemos llevar a casa hoy:


n Alternativas disponibles cuando no se
cumplen las condiciones para usar
pruebas parmetricas

n Como aplicar e interpretar las pruebas de


Wilcoxon, Mann-Whitney, Kruskal-Wallis y
Spearman

n Limitaciones de las pruebas no


paramtricas
Bioestadstica Aplicada

You might also like