You are on page 1of 20

UNIVERSIDAD CATOLICA DE TEMUCO

ESCUELA DE SALUD
BIOESTADISTICA CCB1107
GUIA CATEDRA V BIOESTADISTICA

Prof.: Carola del Valle


Diplomada Epidemiología Clínica
Magíster Epidemiología Clínica
ALGUNAS DISTRIBUCIONES DE PROBABILIDAD

Distribuciones para variable continua

• Distribución normal
• Distribución chi cuadrado
• Distribución t de Student
• Distribución exponencial
• Distribución Gamma
• Distribución Beta
• Distribución F
• Distribución uniforme

Distribuciones de variable discreta

• Distribución binomial
• Distribución binomial negativa
• Distribución Poisson
• Distribución geométrica
• Distribución hipergeométrica
• Distribución de Bernoulli, etc…..

Toda distribución de probabilidad es generada por una variable aleatoria


“X”, la que puede ser de dos tipos:
1. Variable aleatoria discreta (X). Se le denomina variable porque puede
tomar diferentes valores, aleatoria, porque el valor tomado es totalmente al
azar y discreta porque solo puede tomar valores enteros y un número finito
de ellos.
Ejemplos:
X = Variable que nos define el número de burbujas por envase de
vidrio que son generadas en un proceso dado.
X = 0, 1, 2, 3, 4, 5, etc, etc. burbujas por envase
X = Variable que nos define el número de productos defectuosos en
un lote de 25 productos.
X = 0, 1, 2, 3,....,25 productos defectuosos en el lote
X = Variable que nos define el número de alumnos aprobados en la
asignatura de bioestadística en un grupo de 40 alumnos.
X = 0, 1, 2, 3, 4, 5,....,40 alumnos aprobados en bioestadística

Con los ejemplos anteriores nos damos cuenta claramente que los valores de
la variable “X” siempre serán enteros, nunca fraccionarios.
2. Variable aleatoria continua (X). Se le denomina variable porque puede
tomar diferentes valores, aleatoria, porque los valores que toma son
totalmente al azar y continua porque puede tomar tanto valores enteros
como fraccionarios y un número infinito de ellos.

Ejemplos:

X = Variable que nos define el diámetro de un engrane en pulgadas


X = 5.0, 4.99, 4.98, 5.0, 5.01, 5.0, 4.96

X = Variable que nos define la longitud de un cable o circuito utilizado en un


arnés de auto
X = 20.5 cm, 20.1, 20.0, 19.8, 20,6, 20.0, 20.0

X = Variable que nos define la concentración en gramos de plata de algunas


muestras de mineral
X = 14.8gramos, 12.0, 10.0, 42.3, 15.0, 18.4, 19.0, 21.0, 20.8

Como se observa en los ejemplos anteriores, una variable continua puede


tomar cualquier valor, entero o fraccionario, una forma de distinguir cuando
se trata de una variable continua.

Las variables descritas anteriormente nos generan una distribución de


probabilidad, las que pueden ser.

1) Distribución de probabilidad discreta.


2) Distribución de probabilidad continua.

Las características de cada una de las distribuciones anteriores se


mencionarán a continuación:

DISTRIBUCIÓN DE PROBABILIDAD DISCRETA.


Características:
1. Es generada por una variable discreta (X).

X = Variable que solo toma valores enteros


X = 0, 1, 2, 3, 4, 5, 6, 7, 8, ... etc, etc.
2. Las probabilidades asociadas a cada uno de los valores que toma x
deben ser mayores o iguales a cero.

3. La sumatoria de las probabilidades asociadas a cada uno de los valores


que toma x debe ser igual a 1.

DISTRIBUCIÓN DE PROBABILIDAD CONTINUA

Características:
1. Es generada por una variable continua (X).

X Es una variable que puede tomar tanto valores enteros como


fraccionarios.

X = 1.0, 3.7, 4.0, 4.6, 7.9, 8.0, 8.3, 11.5, .....

2. Las probabilidades asociadas a cada uno de los valores que toma “X”
deben ser mayores o iguales a cero. Dicho de otra forma, la función
de densidad de probabilidad deberá tomar solo valores mayores o
iguales a cero. La función de densidad de probabilidad sólo puede
estar definida en los cuadrantes I y II.

3. La sumatoria de las probabilidades asociadas a cada uno


de los valores que toma x debe ser igual a 1. El área definida bajo la
función de densidad de probabilidad deberá ser de 1.

DISTRIBUCIÓN NORMAL O GAUSSIANA

La distribución normal es un modelo matemático que rige muchos


fenómenos, principalmente biológicos.

La distribución normal fue reconocida por primera vez por el francés


Abraham de Moivre (1667-1754).

Posteriormente, Carl Friedrich Gauss (1777-1855) elaboró desarrollos más


profundos y formuló la ecuación de la curva normal o campana de Gauss.
En bioestadística y probabilidad se llama distribución normal, distribución
de Gauss o distribución gaussiana, a una de las distribuciones de
probabilidad que con más frecuencia aparece en fenómenos reales.

La gráfica de su función de densidad tiene una forma acampanada y es


simétrica respecto de un determinado parámetro.

Esta curva se conoce como campana de gauss.

La importancia de esta distribución radica en que permite modelizar


numerosos fenómenos naturales, sociales y psicológicos

La curva de densidad normal es simétrica y unimodal y con forma de


“campana”.

Con desviación estándar muy grande


Con desviación estándar muy pequeña

Usando como base el histograma estimado en la variable peso

Para la variable edad


Algunas propiedades de la distribución normal:

• Tiene una única moda, que coincide con la media y mediana.


• La curva normal es asintótica al eje de abscisas.
• El área total bajo la curva es igual a 1.
• Es simétrica con respecto a su media.
• Muchos de los procedimientos estadísticos requieren la normalidad de
los datos observados.
• Los puntos de inflexión en la curva quedan situados a igual distancia de
la media.
• Dicha distancia es un desvío estándar, entonces los puntos de inflexión
son µ - σ y µ + σ (promedio y desviación estándar poblacionales)
• El área total debajo de la curva es igual a 1.

Ejemplos de variables asociadas a fenómenos que siguen el modelo de la


normal son:

• Caracteres morfológicos de individuos como la estatura


• Caracteres psicológicos como el coeficiente intelectual
• Caracteres fisiológicos como el efecto de un fármaco
• Peso al nacimiento
• Nivel de ruido en telecomunicaciones

Esta distribución nos da la probabilidad de que al elegir un valor, éste tenga


una medida contenida en unos intervalos definidos. Esto permitirá predecir
de forma aproximada, el comportamiento futuro de un proceso, dado los
datos del presente.
EJ:
Aproximadamente el 68% de todos los valores de una población
normalmente distribuida se encuentra dentro de ± 1 desviación estándar de
la media.
Aproximadamente el 96 % de todos los valores de una población
normalmente distribuida se encuentra dentro de ± 2 desviaciones estándar
de la media.
Aproximadamente el 99,8 % de todos los valores de una población
normalmente distribuida se encuentra dentro de ± 3 desviaciones estándar
de la media.
Aproximadamente el 99,99 % de todos los valores de una población
normalmente distribuida se encuentra dentro de ± 4 desviaciones estándar
de la media.

O lo que muchos textos u otros investigadores sugieren, es trabajar solo


con margen de tres desviaciones estándar:

Aproximadamente el 68% de todos los valores de una población


normalmente distribuida se encuentra dentro de ± 1 desviación estándar de
la media.
Aproximadamente el 95 % de todos los valores de una población
normalmente distribuida se encuentra dentro de ± 2 desviaciones estándar
de la media.
Aproximadamente el 99 % de todos los valores de una población
normalmente distribuida se encuentra dentro de ± 3 desviaciones estándar
de la media.
COMPLEMENTAR CON APUNTE COMPLEMENTARIO DE
DISTRIBUCION NORMAL
SIMETRIA Y KURTOSIS

En primer lugar, deberemos conocer si los datos se distribuyen de una


forma simétrica con respecto a su media o presentan algún grado de
asimetría, recuerde que ésta es una de las características fundamentales de
la distribución de Gauss.
Aunque la simetría de una distribución de datos pueda valorarse, de modo
simple, atendiendo a algunas medidas descriptivas de la variable en cuestión
(comparando, por ejemplo, los valores de media, mediana y moda), resultará
útil disponer de algún índice que nos permita cuantificar cualquier
desviación.
Cuando hablamos de simetría en una distribución nos referimos básicamente
a cuando estas 3 medidas coinciden (mediana, moda, y media). Cuando la
distribución de frecuencias es asimétrica estos 3 valores se apartan uno de
otro, mientras más se separe la Me, de la Mo mayor es la asimetría.
La curva de distribución de frecuencias puede ser asimétrica hacia el lado
derecho de la escala de la “X” (positivamente asimétrica) o hacia el lado
izquierda del eje de la “X” (negativamente asimétrica)
Para obtener el coeficiente de asimetría (C.A.) se usa la siguiente fórmula:

Coeficiente de asimetría de K. Pearson.

C.A. = (X¯ – Mo)


d.e.
Solo en caso de distribuciones unimodales

Ej.: La distribución en km recorridas por 20 estudiantes al ir a una


universidad, arrojaron como promedio 5.1 km, una Mo de 6.7 y D.E. de 2.23
calcule el Coeficiente de Asimetría.

C.A. = 5.1 – 6.7


2.23

C.A. = - 0.72
Como el coeficiente es negativo la distribución es asimétrica hacia la
izquierda, o hacia los valores más pequeños en la escala de la “X”.
La medida de apuntamiento o kurtosis puede ser usado para mostrar el
grado de concentración ya sea alrededor de la Media (curva apuntada) o
descentralizada respecto de la Media hacia ambos extremos de la curva de
frecuencia (curva achatada)

Una medida de Kurtosis puede ser obtenida mediante el uso de formulas.


Cuando hablamos de kurtosis de una distribución unimodal está relacionada
con el grado de apuntamiento de una distribución en relación al tamaño de
sus colas encontrándonos con distribuciones:

a) Leptocurticas: se habla de leptokurtica cuando la distribución es


apuntada y con largas colas.
b) Mesokurticas: distribución simétrica.
c) Platikurticas: es cuando la distribución es más bien plana y de colas
cortas.

DISTRIBUCIÓN CHI CUADRADO

Que es una hipótesis???

Presunción de la que parte un investigador para realizar una investigación.


Suposición o conjetura concerniente a una característica de la población.

Ej.: Ho
H1

Formulación de una hipótesis.

Ej.:

Ho = No existe relación entre el sexo y el nivel educacional de un grupo de


trabajadores.

H1 = Existe relación entre el sexo y el nivel educacional de un grupo de


trabajadores.

Esta hipótesis debe ser aceptada o rechazada, o sea probar su validez ya


que puede o no ser verdadera. Esto se realiza a través de estadística de
prueba o pruebas de hipótesis.
Pruebas de Hipótesis

• Una prueba de hipótesis estadística, es cualquier regla (análisis) que


nos permita decidir si rechazar Ho

• Esta decisión se basa en alguna estadística apropiada que recibe el


nombre de estadística de prueba

• Según ciertos valores de este análisis la decisión será rechazar Ho o


aceptar Ho.

Secuencia
Una prueba de hipótesis lleva a

Pero…

Rechazar Ho → Cuando Ho es verdadera


→ Cuando Ho es falsa

Aceptarla → Cuando Ho es verdadera


→ Cuando Ho es falsa

Por o tanto al aceptar o rechazar una Ho puedo cometer un error…

Error tipo I α : es el que se comete cuando rechazamos una Ho cuando esta


realmente era verdadera.
Error tipo II β: se refiere a cuando aceptamos una Ho cuando esta era
falsa.

Esta decisión puede ser correcta o incorrecta…

Nivel de significancia.

La máxima probabilidad de cometer un error tipo I, es a lo que le


llamaremos nivel de significancia estadística o significación, en la práctica
se trabaja con:

α = 0.05 (5%)
α = 0.01 (1%)
Esto significa que si seleccionamos un nivel de significancia de 0,05 la
probabilidad de cometer un error al rechazar la Ho, cuando esta es
verdadera es del 5%

O sea tenemos el 95% de confianza de haber tomado la decisión correcta,


(1 – α)

Prueba de bondad de ajuste chi- cuadrado X²

La prueba chi-cuadrado denotada “X²”, es frecuentemente usada para


probar hipótesis concernientes a la diferencia entre un conjunto de
frecuencias observadas de una muestra y un conjunto correspondiente de
frecuencias teóricas o esperadas.

Usada para buscar asociaciones, relaciones o dependencia entre dos


variables cualitativas.

• Para poder utilizar la prueba chi-cuadrado primero debemos tener


claro que esta prueba se usa estrictamente con variables
cualitativas.

• Luego de identificadas las variables en que se desea buscar


asociación o posibles asociaciones, se ordenan los datos de esas
variables en una tabla de contingencia o de clasificación cruzada.

Tablas de contingencia
Una tabla de contingencia es una tabla de clasificación cruzada o de
doble entrada que muestra las frecuencias observadas de una muestra,
cuando hay r filas y k columnas
La tabla se llamará tabla de contingencia de
“r X k”.

Ej.: una tabla de contingencia de 2 X 2 tiene 2 filas y 2 columnas, o sea hay


4 celdas

• Las frecuencias en las celdas son llamadas frecuencias


bidimensionales.

• El total de frecuencias de una fila o de una columna son llamadas


totales marginales.
Probar la Ho: no hay asociación entre el Sexo y el nivel de educación de una
muestra de pacientes de la IX región.

“O sea estamos intentando probar a través de una prueba de hipótesis que


el nivel educacional alcanzado por un grupo de personas no depende del sexo
de estas”

Que hacemos entonces???????

(Encontrar el valor X². (asumiendo un nivel de significancia de 0.05))

A partir de una tabla de contingencia que nos muestra el comportamiento de


los datos en la muestra (tabla de contingencia para datos observados),
calculamos una tabla de contingencia de valores esperados.

Para calcular el equivalente a la


frecuencia bidimensional 4
tomamos el total de su columna
lo multiplicamos por el total de
su fila y lo dividimos por el
tamaño de la muestra.
Ej: (60X10) / 100 = 6
Ambas tablas de frecuencias observadas y de frecuencias esperadas

La distribución X², además trabaja con grados de libertad.

En este caso tenemos 3 filas y 2 columnas, o sea una tabla de 3X2 y para
obtener los grados de libertad aplico la siguiente expresión:

(r – 1) * (k – 1) = grados de libertad

Estos se calculan tomando la cantidad de filas menos 1 y se multiplica por la


cantidad de columnas menos 1.

(3 – 1) * (2 – 1) = 2 grados de libertad

Los ocupo cuando necesito encontrar el valor chi- cuadrado tabulado en


una de distribuciones chi-cuadrado (tabla).

Ahora podemos aplicar sobre nuestros datos la formula de la prueba chi-


cuadrado que mide la asociación entre dos variables cualitativas.
X² = (4-6)² + (6-4)² + (19–18)² + (11-12)² + (37-36)² + (23-24)²
6 4 18 12 36 24

X² = 1,875

El valor X² calculado es 1,875

Ahora busco en la tabla el valor de X² tabulado, con 2 grados de libertad y


un 0.05 de significancia

Tabla de distribución chi-cuadrado

De esta tabla con los grados de libertad y el nivel de significancia obtiene el


chi-cuadrado crítico o tabulado

El valor X² tabulado es 5,99


El valor X² calculado es más pequeño que el valor tabulado o crítico

X² calculado= 1,875 ≤ X² tabulado= 5,99


La distribución chi-cuadrado gráficamente se divide en región de aceptación
y de rechazo de una hipótesis nula según el chi-cuadrado crítico.

Podemos conservar la hipótesis nula con un 95% de confianza

La Ho afirmaba: no hay asociación entre el Sexo y el nivel de educación de


una muestra de pacientes de la IX región

Según resultados las variables no están relacionadas, una no afecta el


comportamiento de la otra, o sea el nivel educacional no depende del sexo
de los pacientes.

Análisis chi-cuadrado en SPSS


• El análisis χ² cuando es realizado a través de una programa
estadístico, se compara con el nivel de significancia.

• Cuando tengo un resultado de χ²≤ 0,05; debo rechazar la Ho; por lo


tanto; existe relación entre las variables que estoy estudiando.

• Cuando χ²> 0,05; debo conservar la Ho; por lo tanto; no existe


relación entre las variables que estoy estudiando.

Finalidad Guía V Cátedra

1.- Repasar los contenidos ya vistos en esta asignatura, como por ejemplo
aclarar muy bien la construcción de la tabla de contingencia
2.- Comprender los contenidos hasta acá vistos en esta asignatura, todo lo
de estadística descriptiva debe estar claro
3.- Aclarar las dudas conceptuales y procedimentales de los contenidos
hasta acá vistos, aclare las dudas de estadística descriptiva que aún tenga
4.- Resumir los principales conceptos de esta guía para extraer la
información más útil a ocupar de aquí en adelante
5.- Indicar las principales críticas y comentarios en general de la guía

Al finalizar su lectura deberá estar en condiciones de:

1.- Investigue que es la distribución normal y sus implicancias y busque 2


ejemplos en su área de variables que presenten distribución normal y
explíquelos claramente
2.- Explique y de ejemplos de los conceptos de hipótesis nula y alternativa
3.- Explique, a su parecer cual es la importancia de aplicar las pruebas de
hipótesis
4.- Identificar los pasos a seguir para el cálculo del análisis chi-cuadrado
con formula y su interpretación
5.- Explique claramente el significado del nivel de significancia estadística
6.- Una vez realizado el laboratorio del análisis chi cuadrado, explique
claramente las diferencias entre el calculo de esta distribución con formula
y a través del SPSS

You might also like