Professional Documents
Culture Documents
INTRODUCCIÓ
INTRODUCCIÓN A LA
INVESTIGACIÓ
INVESTIGACIÓN EN
ENFERMERÍ
ENFERMERÍA
Guadalupe Ruiz Merino
I
1
ESTADÍ
ESTAD
N
SESIÓ
SESIÓN I
SESIÓN
RESUMEN DE DATOS CON
ÚMEROS.
NÚMEROS.
ÍSTICA DESCRIPTIVA
ESTADÍSTICA
Guadalupe Ruiz Merino - Curso de Fundamentos de Bioestadí
Bioestadística
1 2 3 4 1 2 3 4
II III SESIÓ
SESIÓN II
Grá
Gráficos.
Gráficos.
1
1 2 3 4 1 2 3 4
IV
Si lo veo lo entiendo.
Si lo hago lo aprendo”
aprendo”.
Confucio (551-
(551-478 A.C)
SESIÓ
SESIÓN IV
Contraste
Contraste de hipó
hipótesis.
hipótesis.
Test estadí
estadísticos.
estadísticos.
Guadalupe Ruiz Merino - Curso de Fundamentos de Bioestadí
Bioestadística Guadalupe Ruiz Merino - Curso de Fundamentos de Bioestadí
Bioestadística
1 2 3 4 1 2 3 4
I I
MEDIDAS DE POSICIÓ
POSICIÓN:
ESTADÍ
ESTADÍSTICA DESCRIPTIVA Es un nú
número que indica có
cómo se encuentran el
resto de los datos con respecto a él.
Medidas de posició
posición . Las má
más usuales se refieren a un nú
número central,
que intenta representar a toda la muestra.
Medidas de dispersió
dispersión.
2
1 2 3 4 1 2 3 4
I I
MEDIA MEDIA.EJEMPLO
Peso en gramos de riñ
riñones de 7 hombres de 40 a
50 añ
años:
Se usa cuando se pueden sumar los nú
números. Muestras: 208,252,256,277,301,309,319.
Muy sensible a valores extremos. Sumatorio ∑ xi= 1671.
Poca variabilidad de una muestra a otra.
Media=1671/7=238.71.
1 2 3 4 1 2 3 4
I I
MEDIANA MEDIANA.EJEMPLO
Es aqué
aquél valor perteneciente o no a la muestra que
Peso en gramos de riñ
riñones de hombres de 40 a 50 añ
años:
deja tantas observaciones por debajo como por encima .
Se ordenan los valores de menor a mayor y se Muestras: 208,252,256,277,301,309,319.
3
1 2 3 4 1 2 3 4
I I
PERCENTILES. EJEMPLO.
La Mediana divide a la muestra en 2 partes iguales. Afirmar que el percentil 10 del peso de los niñ
niños varones
Los percentiles o cuantiles dividen a la muestra en 100 recié
recién nacidos es 2700 gr. indica que só
sólo un 10% de los
partes iguales. niñ
niños tiene un peso inferior a 2700.
Se denotan por pi. El percentil i es aquel valor que deja a
su izquierda el i% de los valores de la muestra ordenada.
Muy utilizados para describir los casos “raros”
raros” de la
població
población.
1 2 3 4 1 2 3 4
I I
CUARTILES. DECILES.
Algunos percentiles reciben nombres especiales: De igual manera a los percentiles p10,……,
……, p90
p25, p50, p75 se llaman primer, segundo y tercer
se les llama deciles.
cuartil.
cuartil.
Dejan a su izquierda la cuarta parte, la mitad y las
tres cuartas partes respectivamente de la muestra
ordenada.
Dividen la muestra en cuatro partes iguales.
4
1 2 3 4 1 2 3 4
I I
MODA. MODA.
La moda es el valor que se presenta con mayor Cuando un grupo de datos tiene dos modas se
frecuencia que sus adyacentes. llama bimodal.
bimodal.
Dan un má
máximo o pico en el polí
polígono de Ejemplo:
frecuencias. Presió
Presión sanguí
sanguínea, una moda para los
Con grandes cantidades de datos para designar normotensos y otra para los hipertensos.
el valor que má
más se repite.
1 2 3 4 1 2 3 4
I I
¿Cuá
Cuál es la má
más adecuada? ¿Cuá
Cuál es la má
más adecuada?
5
1 2 3 4 1 2 3 4
I I
MEDIDAS DE DISPERSIÓ
DISPERSIÓN.
1 2 3 4 1 2 3 4
I I
MEDIDAS DE DISPERSIÓ
DISPERSIÓN. MEDIDAS DE DISPERSIÓ
DISPERSIÓN.
6
1 2 3 4 1 2 3 4
I I
RECORRIDO. RECORRIDO.
-Es la má
más simple y de mayor valor intuitivo. -Ventajas:
-Se calcula como la diferencia entre el valor má
más -Se expresa en las mismas unidades de la
grande y el má
más pequeñ
pequeño de la muestra. muestra.
-R= xmax-xmin -Es fá
fácil de calcular.
-Inconvenientes:
-Utiliza só
sólo dos elementos de la muestra.
1 2 3 4 1 2 3 4
I I
VARIANZA, DESVIACIÓ
DESVIACIÓN TÍ
TÍPICA. VARIANZA, DESVIACIÓ
DESVIACIÓN TÍ
TÍPICA.
-Una medida de dispersió
dispersión adecuada utiliza la -Para que tenga las mismas unidades de la
distancia entre cada dato con respecto a la muestra se calcula su raí
raíz cuadrada.
media. (Desviació
(Desviación tí
típica)
-Para evitar valores negativos se eleva esta
diferencia al cuadrado.(Varianza)
7
1 2 3 4 1 2 3 4
I I
COEFICIENTE DE VARIACIÓ
VARIACIÓN. VARIANZA, DESVIACIÓ
DESVIACIÓN TÍ
TÍPICA.
-Se usa con variables que tienen todos los EJERCICIOS.
valores positivos.
1 2 3 4 1 2 3 4
DEFINICIONES
II II
-Los distintos modos de presentar un dato
cualitativo se llama clase.
SESIÓ
SESIÓN II -El nú
número de individuos que presentan cada
Tablas y Grá
Gráficas.
Gráficas. una de las clases se llama frecuencia.
8
1 2 3 4 1 2 3 4
III III
DE CONTINGENCIA DE CONTINGENCIA
OBJETIVOS:
Las tablas de contingencia tienen un objetivo
fundamental:
Tabla de contingencia:
contingencia: Tabla de doble 1.-
1.- Organizar la informació
información, cuando está
está
entrada donde en cada casilla figura el nú
número referida a factores.
de individuos que posee esas caracterí
características.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4 1 2 3 4
RESUMEN DE DATOS
III II
Definició
Definición:
Frecuencia: Nú
Número de veces que se presenta un valor dado
NUMÉ
NUMÉRICOS CON GRÁ
GRÁFICOS
de una observació
observación.
nij=nº
=nº observaciones de la fila i y la columna j.
Las representaciones grá
gráficas constituyen uno
de los principales mé
métodos de exponer la
HOMBRE MUJER MARGINAL
informació
información.
SI n11 n12 n1. Dan una informació
información rárápida y global.
Permiten tener una idea general de los
NO n21 n22 N2. resultados.
MARGINAL n.1 n.2 n..
Sugieren nuevas hipó
hipótesis.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
9
1 2 3 4 1 2 3 4
HISTOGRAMA HISTOGRAMA.EJEMPLO
Es vá
II II
Es la representació
representación grá
gráfica má
más frecuente.
válido para cualquier tipo de dato.
Las clases se representan en el eje horizontal y
las frecuencias en el vertical.
Cuando los datos son ordinales conviene
insertarlos en su orden ló
lógico.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4 1 2 3 4
POLÍ
POLÍGONOS DE FRECUENCIAS POLÍ
POLÍGONOS DE FRECUENCIAS
II II
Especialmente indicado para datos
cuantitativos.
A cada clase se le asigna un punto en el eje de
abcisas y un punto en el eje de ordenadas que
es su frecuencia.
Muy útil para ver có
cómo evolucionan las
frecuencias.
10
1 2 3 4 1 2 3 4
POLÍ
POLÍGONOS DE FRECUENCIAS POLÍ
POLÍGONOS DE FRECUENCIAS
II II
En el grá
gráfico anterior
¿Cuá
Cuál serí
sería la Moda?
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4 1 2 3 4
OBSERVACIONES
II III
Las representaciones grá
gráficas deben verificar
las siguientes condiciones:
-Deben indicar claramente las escalas y
unidades de medida.
SESIÓ
SESIÓN III
-Deben explicarse por sí
sí solas. Deben
poseer un tí
título completamente explicativo.
Estimació
Estimaci ón.
Estimación.
-Deben contribuir a clarificar el material
presentado. Error está
está ndar.
estándar.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística Guadalupe Ruiz Merino - Curso de Fundamentos de Bioestadí
Bioestadística
11
1 2 3 4 1 2 3 4
I I
DEFINICIÓ
DEFINICIÓN DE ESTIMACIÓ
ESTIMACIÓN
SESIÓ
SESIÓN II ESTIMACIÓ
ESTIMACIÓN
Proceso de utilizar informació
información de una muestra
para extraer conclusiones acerca de toda la
Concepto de Estimació
Estimación població
población.
Error está
estándar Se utiliza la informació
información para estimar un valor.
Intervalo de Confianza
1 2 3 4 1 2 3 4
I I
TIPOS DE ESTIMACIÓ
ESTIMACIÓN
PROPIEDADES ESTIMACIÓ
ESTIMACIÓN
No tener sesgos. PUNTUAL:
PUNTUAL: Se obtiene un único nú
número al que se le puede
asignar un punto de la recta.
Poca variabilidad de una muestra a otra.
POR INTERVALOS:
INTERVALOS: Se obtienen dos puntos que
representan un (li
(li,, ls).
ls).
12
1 2 3 4 1 2 3 4
I I
CONCEPTO DE ESTIMACIÓ
ESTIMACIÓN
Estimador puntual difiere del
Ser un estimador adecuado no significa ..., significa ...
verdadero valor.
Es deseable acompañ
acompañar la estimació
estimación
de alguna medida posible de error.
... manejo de la incertidumbre
y de la imprecisión
1 2 3 4 1 2 3 4
I I
Estimació
Estimación por intervalos
ERROR ESTÁ
ESTÁNDAR
Asociado a cada estimació
estimación:
Diferencia entre el valor probable y los
Un intervalo.
valores reales de la variable dependiente.
Una medida de confianza.
confianza.
13
1 2 3 4 1 2 3 4
INTERVALO DE CONFIANZA
Un espacio que tiene una cierta
probabilidad de contener el verdadero
valor del pará
parámetro desconocido.
I
Guadalupe Ruiz Merino - Curso de Fundamentos de Bioestadí
Bioestadística
MEDIDA DE CONFIANZA
1-α.
Coeficiente de confianza 1-
100(1- α)%.
Nivel de confianza 100(1-
I
Guadalupe Ruiz Merino - Curso de Fundamentos de Bioestadí
Bioestadística
1 2 3 4 1 2 3 4
I I
Elegiremos probabilidades cercanas a
la unidad.
Los I.C.
I.C. se utilizan como indicadores de la
Lo decidimos nosotros.
variabilidad de las estimaciones.
95%-------1-α=0.95-------
95%-------1 α=0.05
=0.95-------α Cuá
Cuánto má
más “estrecho”
estrecho” sea mejor.
90%-------1-α=0.90-------
90%-------1 α=0.01 99%-------
=0.90-------α 99%-------
1-α=0.99-------α=0.001
=0.99-------α
14
1 2 3 4 1 2 3 4
I I
Los I.C.
I.C. se pueden crear para
cualquier pará
parámetro de la població
población: TAMAÑ
TAMAÑO DE LA MUESTRA
Media:
Media: tiempo medio de recuperació
recuperación
Con poblaciones de un tamañ
tamaño N
suficientemente grande es imposible
Proporció
Proporción: de niñ
niños que sufren apendicitis.
determinar el valor exacto de un
Desviació
Desviación está
estándar:
ndar: del error de medida de un pará
parámetro.
aparato mé
médico. Se utiliza entonces una muestra.
1 2 3 4 1 2 3 4
I I
TAMAÑ
TAMAÑO DE LA MUESTRA TAMAÑ
TAMAÑO DE LA MUESTRA
Requiere establecer como condició
condición Estimar una media:
15
1 2 3 4 1 2 3 4
I I
TAMAÑ
TAMAÑO DE LA MUESTRA TAMAÑ
TAMAÑO DE LA MUESTRA
Estimar una media: Inconvenientes.
σ2 puede ser desconocido.
Dos posibilidades:
-Sustituirlo por el valor má
máximo que se
piense puede tomar (por experiencia previa o
bibliografí
bibliografía)
1 2 3 4 1 2 3 4
I I
TAMAÑ
TAMAÑO DE LA MUESTRA TAMAÑ
TAMAÑO DE LA MUESTRA
-Tomar una muestra pequeñ
pequeña y calcular su Para una proporció
proporción.
desviació
desviación tí
típica.
16
1 2 3 4 1 2 3 4
I I
TAMAÑ
TAMAÑO DE LA MUESTRA TAMAÑ
TAMAÑO DE LA MUESTRA
Para una proporció
proporción. EJERCICIOS.
n depende de p y puede ser desconocida.
Sustituir p por 0.5.
De esta manera maximizamos el tamañ
tamaño de
muestra.
1 2 3 4 1 2 3 4
IV I
INFERENCIA ESTADÍ
ESTADÍSTICA
Contraste de Hipó
Hipótesis.
Métodos Paramé
Paramétricos.
tricos.
Trasformaciones de datos.
Métodos No Paramé
Paramétricos.
tricos.
SESIÓ
SESIÓN IV
Contraste
Contraste de hipó
hipótesis.
hipótesis.
Test estadí
estadísticos.
estadísticos.
Guadalupe Ruiz Merino - Curso de Fundamentos de Bioestadí
Bioestadística Guadalupe Ruiz Merino - Curso de Fundamentos de Bioestadí
Bioestadística
17
1 2 3 4 1 2 3 4
I II
CONTRASTE DE HIPÓ
HIPÓTESIS
INFERENCIA ESTADÍ
ESTADÍSTICA
A diferencia que en la estimació
estimación
primero se formula una hipó
hipótesis y
Métodos empleados para sacar conclusiones a
partir de una muestra y extenderlas a una despué
después se rechaza o no.
població
población.
1 2 3 4 1 2 3 4
CONTRASTE DE HIPÓ
HIPÓTESIS CONTRASTE DE HIPÓ
HIPÓTESIS
II II
PASO 1
PASO 2
Expresar el interrogante de la investigació
investigación como
una hipó
hipótesis estadí
estadística. Decidir sobre la prueba estadí
estadística adecuada.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
18
1 2 3 4 1 2 3 4
CONTRASTE DE HIPÓ
HIPÓTESIS CONTRASTE DE HIPÓ
HIPÓTESIS
II II
PASO 3
PASO 4
Seleccionar grado de significació
significación para la prueba
estadí
estadística.
Realizar los cá
cálculos y exponer conclusiones.
Grado de significació
significación = alfa = probabilidad de
rechazar de manera incorrecta H0 cuando sea cierta
(normalmente 0.05,0.01,0.001)
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4 1 2 3 4
CONTRASTE DE HIPÓ
HIPÓTESIS CONTRASTE DE HIPÓ
HIPÓTESIS
II II
ERRORES EN LAS PRUEBAS DE HIPÓ
HIPÓTESIS ERRORES:
Existe diferencia No existe β= Probabilidad de error tipo II
H1 diferencia H0 Potencia=1-β
Potencia=1-
No existe negativo,β
Falso negativo,β
diferencia Error tipo II
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
19
1 2 3 4 1 2 3 4
CONTRASTE DE HIPÓ
HIPÓTESIS CONTRASTE DE HIPÓ
HIPÓTESIS
II II
Valor de p
ERRORES:
Se puede considerar p como la probabilidad de que el
resultado obtenido sea debido al azar.
¿Cómo se puede aumentar la potencia de un test?
test?
p se calcula despué
después de la prueba estadí p<α
estadística. Si p<α
Aumentando el tamañ
tamaño de la muestra.
se rechaza H0.
¿Y si no lo es? ¿Qué
Qué conclusió
conclusión sacamos?
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4 1 2 3 4
Métodos para el
TIPOS DE DISEÑO
CONTRASTE DE HIPÓ
HIPÓTESIS
II II
Métodos paramé
paramétricos.
tricos. Variable dependiente Variable Test
independiente
Variables independientes.
Cualitativa dicotó
dicotómica Cuantitativa T-Student
Variables dependientes.
Trasformaciones logarí
logarítmicas. Cualitativa ordinal Cuantitativa ANOVA
Métodos no paramé
paramétricos.
tricos.
Cualitativa dicotó
dicotómica Cualitativa dicotó
dicotómia Fisher
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
20
1 2 3 4 1 2 3 4
Métodos paramétricos Métodos para el
CONTRASTE DE HIPÓ
HIPÓTESIS
II II
T-Student:
Student:
Los test de contraste de hipó
hipótesis pueden ser
Método estadí
estadístico má
más utilizado.
unilaterales o bilaterales.
Condiciones:
Se usan los test unilaterales cuando sospechas que
-La muestra se ajuste a un modelo lineal.
una media es mayor que otra
-Datos distribuidos normalmente e independientes
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4 1 2 3 4
Métodos para el Datos pareados
CONTRASTE DE HIPÓ
HIPÓTESIS
II II
Ejemplo:
1 100 95
2 89 84
3 83 78
4 98 93
5 108 103
6 95 90
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
21
1 2 3 4 1 2 3 4
Datos pareados Datos pareados
II II
Extraemos una muestra de 3 individuos y calculamos El fallo está
está en que la variable de estudio, en
su peso medio antes de la dieta: 89 kg.
kg. este caso el peso,
peso, es muy distinta de un
Extraemos otra muestra de 3 individuos y calculamos individuo a otro.
que su peso despué
después de la dieta es de 97 kg.
kg.
Una manera de controlar esta variabilidad es
Concluimos por tanto que la dieta no es eficaz. coger una única muestra de pacientes y
calcular su peso antes y despué
después de la dieta.
¡FALSO!
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4 1 2 3 4
Datos pareados Datos pareados
II II
Hacemos un estudio de datos apareados cuando Éstos estudios necesitan una manera de
el mismo grupo se mide dos veces: controlar los datos entre pacientes. El objetivo
Los individuos se miden al principio del es controlar factores extraños que podrían
tratamiento para establecer una lílínea basal y influir en el resultado.
despué
después de alguna intervenció
intervención se repite la La prueba estadística que se utiliza cuando
medició
medición en los mismos sujetos.
sujetos. los mismos individuos son objeto de medición
de una variable numérica es la prueba t-
Student para datos apareados.
Debemos asumir que la diferencia de las
medias sigue una distribución normal.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
22
1 2 3 4 1 2 3 4
ANOVA
II II
¿Y SI QUEREMOS ESTUDIAR LA El té
término factor se refiere a la variable por la
INFLUENCIA DE MÁ
MÁS DE UN FACTOR? cual se forman los grupos.
Ej:
Ej: dividir en grupos con base a su estado de
tiroides y terapia.
Al nú
número de grupos definido por un factor se
le conoce como nú número de niveles.
ANOVA En estudios experimentales en medicina a los
niveles se les llama tratamiento.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4 1 2 3 4
ANOVA ANOVA
II II
Muchos de los proyectos en medicina utilizan P corregida
más de dos grupos. Si no se realiza la prueba múmúltiple, las distintas
Hay estudios que analizan la influencia de má
más combinaciones entre los grupos alteran el
de un factor. nivel de significació
significación α.
Despué
Después se comprueban las distintas
combinaciones para determinar las diferencias
entre los grupos.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
23
1 2 3 4 1 2 3 4
ANOVA ANOVA
II II
Ejemplo: Una manera de compensar las comparaciones
Supongamos que queremos estudiar las posibles múltiples es disminuir el nivel α dividiendo α
diferencias entre las medias de 4 grupos dos a dos. entre el nú
número de comparaciones hechas.
Tendrí
Tendríamos 4*2=8 posibilidades de cometer un error de
tipo I con un nivel α=0.05. Por ejemplo en el caso anterior si se hacen 4
La posibilidad de que cada comparació
comparación significativa fuera
comparaciones α se divide entre 4 para
falsa serí
sería de 5%,e.d
5%,e.d,, el total de posibilidad de declarar obtener una comparació
comparación de 0.05/4=0.0125.
una de las comparaciones como significativa, de forma Con este mé
método cada comparació
comparación debe ser
incorrecta serí
sería de un 40%. significativa al nivel de 0.0125 para declararla
como tal.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4 1 2 3 4
ANOVA ANOVA
II II
La forma de analizar los datos con Se asumen grupos de variable con distribució
distribución
observaciones mú
múltiples se llama ANOVA. normal.
Debe haber homogeneidad en las varianzas.
Éste mé
método protege al investigador contra el Las variables son independientes, e.d,
e.d, no se
“error”
error” inflacció
inflacción, preguntando primero si hay relaciona en forma alguna con el valor de otra.
diferencias entre las medias de los grupos. Si el ANOVA da significativo, estudiamos la
diferencia entre las medias.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
24
1 2 3 4 1 2 3 4
TRANSFORMACIÓN DE TRANSFORMACIÓN DE
OBSERVACIONES OBSERVACIONES
II II
Si las observaciones está
están muy sesgadas no Las transformaciones mámás comunes son las
debe emplearse la t-
t-Student.
Student. En este caso las logarí
logarítmicas, tanto en base 10 como logaritmo
observaciones deben ser transformadas o neperiano aunque hay que tener cuidado con
readaptadas. los valores iguales a cero.
Las transformaciones logarí
logarítmicas se emplean
Tambié
También se pueden usar mémétodos no con frecuencia cuando se trata de valores de
paramé
paramétricos.
tricos. laboratorio que tienen distribució
distribución sesgada o
cuando hay mucha dispersió
dispersión.
Otra transformació
transformación, menos utilizada, es la raí
raíz
cuadrada.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4 1 2 3 4
MÉTODOS NO PARAMÉTRICOS MÉTODOS NO PARAMÉTRICOS
II II
Son pruebas estadí
estadísticas que no genera Variable dependiente: cualitativa dicotó
dicotómica.
premisas sobre la distribució
distribución de las Variable independiente: cuantitativa.
observaciones. -Para un solo grupo:
Usar la prueba t requiere que se dé
dé por supuesto Variables independientes.
que las diferencias siguen una distribució
distribución
normal, lo cual es especialmente importante -test de la prueba de signo.
cuando los tamañ
tamaños de muestra son
pequeñ
pequeños (n<30).
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
25
1 2 3 4 1 2 3 4
MÉTODOS NO PARAMÉTRICOS VARIOS GRUPOS
II II
Variable dependiente: cualitativa dicotó
dicotómica.
Variable independiente: cuantitativa. La alternativa no paramé
paramétrica al ANOVA es el
-Para un solo grupo: contraste de Kruskal-
Kruskal-Wallis.
Wallis.
Variables independientes.
Sirve para contrastar la hipó
hipótesis de que k
-test de la prueba de signo.
muestras alternativas provienen de la misma
Variables dependientes:
població
población.
-tests de la prueba de signo aplicado a la
diferencia (de medias, proporció
proporción,…
n,…) En el caso de existir diferencias podemos hacer
-prueba de Wilcoxon (U-
(U-Mann Whitney)
Whitney) comparaciones a posteriori.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4 1 2 3 4
RESUMEN CONSTRUCCIÓN DE UNA TABLA
II III
DE CONTINGENCIA
Denominamos variables cualitativas a
aquellas cuyo resultado es un valor o Para analizar la relació
relación de dependencia o
categorí independencia entre dos variables cualitativas
categoría de entre un conjunto finito de
respuestas. es necesario estudiar su distribució
distribución conjunta o
tabla de contingencia.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
26
1 2 3 4 1 2 3 4
CONTRASTE DE HIPÓTESIS
CONSTRUCCIÓN DE UNA TABLA
III III
DE CONTINGENCIA Ejemplo:
EJEMPLO:
HOMBRE MUJER MARGINAL
Estudiar la relació
relación entre el sexo y el há
hábito SI 65 58 123
de fumar.
Entre el grupo sanguí
sanguíneo y la posibilidad de NO 43 67 110
rechazar un trasplante.
Entre la prá MARGINAL 108 125 233
práctica de ejercicio y el riesgo de
infarto.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4 1 2 3 4
III III
DE CONTINGENCIA DE CONTINGENCIA
OBJETIVOS: OBJETIVOS:
Las tablas de contingencia tienen dos objetivos
fundamentales: 2.-
2.-Analizar si existe alguna relació
relación de
dependencia o independencia entre los niveles
1.-
1.- Organizar la informació
información, cuando está
está de las variables objeto de estudio.
referida a factores.
El hecho de que dos variables sean
independientes significa que los valores de una
de ellas no está
están influidos por la otra.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
27
1 2 3 4 1 2 3 4
III III
DE CONTINGENCIA
En los ejemplos anteriores: Para identificar relaciones entre variables
cualitativas se utiliza el test estadí
estadístico de la
¿Influye el sexo en el há
hábito de fumar? Chi-
Chi-cuadrado.
cuadrado.
¿Tienen má
más posibilidades los de un cierto Para las tablas 2x2 el test de Fisher.
Fisher.
grupo sanguí
sanguíneo de rechazar un trasplante?
La hipó
hipótesis que plantearemos será
será
H0: independencia
H1: dependencia
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4 1 2 3 4
CONTRASTE DE HIPÓTESIS
CONTRASTE DE HIPÓTESIS
III III
Definició
Definición:
Frecuencia: Nú
Número de veces que se presenta un valor dado
de una observació
observación.
El resultado nos permitirá
permitirá afirmar con un nivel
nij=nº
=nº observaciones de la fila i y la columna j.
de confianza que nosotros determinaremos si
los niveles de una variable influyen en los
HOMBRE MUJER MARGINAL
niveles de la otra.
SI n11 n12 n1.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
28
1 2 3 4 1 2 3 4
CONTRASTE DE HIPÓTESIS CONTRASTE DE HIPÓTESIS
III III
El razonamiento para contrastar si existe o no Si no existe mucha diferencia entre ambos no
asociació
asociación entre dos variables cualitativas se hay razones para dudar de que las variables
basa en calcular cuá cuál serí
serían los valores de sean independientes.
frecuencia esperados para cada una de las
celdas en el caso de que efectivamente las
variables fuesen independientes y compararlos
con los valores realmente observados.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4 1 2 3 4
CONTRASTE DE HIPÓTESIS CONTRASTE DE HIPÓTESIS
III III
Una vez que hayamos hecho los cá cálculos, PROBLEMAS
obtendremos un nivel de significació
significación, e.d,
e.d, la
probabilidad de equivocarnos si rechazamos la 1.-
1.- La Chi-
Chi-cuadarado está
está influenciada por el tamañ
tamaño
hipó
hipótesis nula. muestral.
muestral.
A mayor nú
número de casos analizados el valor de
Si es p<0.05 rechazamos la hipó
hipótesis nula y decimos la Chi-
Chi-cuadrado tiende a aumentar por lo que si
que las variables son dependientes. la muestra es excesivamente grande má más fá
fácil
será
será que rechacemos la hipó hipótesis nula de
Si es p>0.05 no podrí
podríamos rechazar H0 porque la
probabilidad de equivocarnos serí
sería muy alta. independencia cuando a lo mejor podrí podrían ser
independientes.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
29
1 2 3 4 1 2 3 4
CONTRASTE DE HIPÓTESIS
CONTRASTE DE HIPÓTESIS
III III
PROBLEMAS PROBLEMAS
2.-
2.- En cada celda de la tabla deberá
deberá existir un mínimo
de 5 observaciones esperadas.
esperadas. HOMBRE MUJER MARGINAL
Si no fuera así
así: SI 12 32 44
OCASIONALMENTE 3 4 7
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4 1 2 3 4
CONTRASTE DE HIPÓTESIS CONTRASTE DE HIPÓTESIS
III III
PROBLEMAS PROBLEMAS
2.-
2.- ¿Y si la tabla es de 2x2? 3.-
3.- La Chi-
Chi-cuadrado permite contrastar la hipó
hipótesis de
independencia pero en el caso de que se rechace
Se aplica la correcció
corrección de Yates. dicha hipó
hipótesis no dice nada sobre la fuerza de la
asociació
asociación entre las variables estudiadas.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
30
1 2 3 4 1 2 3 4
MEDIDAS DE ASOCIACIÓN MEDIDAS DE ASOCIACIÓN
III III
Las medidas de asociació
asociación distinguen entre
que las variables sean ordinales o nominales.
Las medidas de asociació
asociación nominales sólo Las medidas de asociació
asociación ordinales
informan del grado de asociació
asociación existente aportan informació
información sobre la direcció
dirección de la
pero no de la direcció
dirección. relació
relación, pudiendo tomar tanto valores
positivos como negativos.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4 1 2 3 4
MEDIDAS DE ASOCIACIÓN RESIDUOS
III III
Valores positivos significa que existe una Los residuos son calculados como la
relació
relación directa entre las variables, valores diferencia entre la frecuencia observada y
altos de una se corresponden con valores esperada en cada casilla.
altos de la otra y al contrario. Son muy útiles para interpretar las
relaciones que se observan en la tabla.
Valores negativos implica una relació relación
inversa, e.d,
e.d, valores altos de una variable se Los residuos tipificados indican que la
corresponden con valores bajos de la otra y al diferencia entre las frecuencias es elevada
contrario. cuando su valor es superior a 1.96 ó inferior a
-1.96.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
31
1 2 3 4 1 2 3 4
RESIDUOS USO EXCESIVO
III III
Un residuo tipificado mayor a 1.96 en valor Debido a que la prueba Chi-
Chi-cuadrado es fá
fácil de
absoluto en una casilla indica que hay má más entender y calcular en ocasiones se utiliza
casos, si es positivo, o menos, si es negativo, cuando es mámás apropiado otro mémétodo.
de los que deberí
debería haber en esa casilla si las Por ejemplo: Cuando se analizan dos grupos y
variables fueran independientes. las caracterí
características de interé
interés se miden en
escala numé
numérica.
Un valor comprendido entre ± 1.96 indica que
la diferencia es pequeñ
pequeña por lo que las Cuando los correcto es aplicar la prueba t-
t-
variables en esa casilla son independientes. Student,convierten la escala numé
numérica en una
ordinal o incluso binaria.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4 1 2 3 4
USO EXCESIVO USO EXCESIVO
III III
Ejemplo: Ejemplo:
Pacientes de una intervenció
intervención tienen mayor probabilidad Formaron una tabla de contingenia 2x2 y
de padecer complicaciones que otros. agruparon la edad en ≤45 o >45.
Se recogen datos de pacientes que sufrieron
complicaciones y de otros pacientes que no las
sufrieron. Los investigadores emplearon la prueba de chi-
chi-
Los investigadores querí
querían saber si existe relació
relación entre la
cuadrado para la independencia y los
edad y la probabilidad de tener complicació
complicaciónes.
nes. resultados indicaron que no habí
había relació
relación
entre la edad y la presencia de
complicaciones.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
32
1 2 3 4 1 2 3 4
USO EXCESIVO USO EXCESIVO
III III
¿Dónde está
está el error? Cuando las variables numé
numéricas se analizan con
En la selecció
selección arbitraria de los 45 añ
años como métodos diseñ
diseñados para variables categó
categóricas
punto de corte para la edad. u ordinales, se pierde la mayor especificidad
Y en usar una prueba de forma incorrecta. de las mediciones numé
numéricas.
Antes de hacerlo hay que investigar si las
categorí
categorías son correctas.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
1 2 3 4 1 2 3 4
McNemar McNemar
III III
Una variante de las tablas longitudinales es Se toma una medida de una variable dicotó
dicotómica,
medir una misma variable dicotó
dicotómica se aplica el tratamiento ( o se deja pasar el
(tratamiento-
(tratamiento-no tratamiento, rechazo-
rechazo-no tiempo) y se vuelve a tomar una medida de la
rechazo) en dos momentos temporales misma variable en los mismos sujetos.
distintos. Se contrasta la hipó
hipótesis de igualdad de
Resulta especialmente útil para medir el cambio. proporciones antes y despué
después.
Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística Guadalupe Ruiz Merino – Curso de Fundamentos de Bioestadística
33