You are on page 1of 11

3.1.

Distribucin Normal
En estadstica y probabilidad se
Gauss o distribucin

gaussiana,

llama distribucin
a

una

normal, distribucin

de

las distribuciones

de

de

probabilidad de variable continua que con ms frecuencia aparece aproximada en


fenmenos reales.[cita requerida]
La grfica de su funcin de densidad tiene una forma acampanada y es simtrica
respecto de un determinado parmetro estadstico. Esta curva se conoce
como campana de Gauss y es el grfico de una funcin gaussiana.
La importancia de esta distribucin radica en que permite modelar numerosos
fenmenos naturales, sociales y psicolgicos. Mientras que los mecanismos que
subyacen a gran parte de este tipo de fenmenos son desconocidos, por la
enorme cantidad de variables incontrolables que en ellos intervienen, el uso del
modelo normal puede justificarse asumiendo que cada observacin se obtiene
como la suma de unas pocas causas independientes.
De hecho, la estadstica descriptiva slo permite describir un fenmeno, sin
explicacin alguna. Para la explicacin causal es preciso el diseo experimental,
de ah que al uso de la estadstica en psicologa y sociologa sea conocido como
mtodo correlacional.

3.1.1 Principales caractersticas de la distribucin normal.

La distribucin normal tambin es importante por su relacin con la estimacin


por mnimos cuadrados, uno de los mtodos de estimacin ms simples y
antiguos.
Algunos ejemplos de variables asociadas a fenmenos naturales que siguen el
modelo de la normal son:

caracteres morfolgicos de individuos como la estatura;

caracteres fisiolgicos como el efecto de un frmaco;

caracteres sociolgicos como el consumo de cierto producto por un mismo


grupo de individuos;

caracteres psicolgicos como el cociente intelectual;

nivel de ruido en telecomunicaciones;

errores cometidos al medir ciertas magnitudes;

etc.

La distribucin normal tambin aparece en muchas reas de la propia estadstica.


Por

ejemplo,

la distribucin

muestral

de

las medias mustrales

es

aproximadamente normal, cuando la distribucin de la poblacin de la cual se


extrae la muestra no es normal.1 Adems, la distribucin normal maximiza
la entropa entre todas las distribuciones con media y varianza conocidas, lo cual
la convierte en la eleccin natural de la distribucin subyacente a una lista de
datos resumidos en trminos de media muestral y varianza. La distribucin normal
es la ms extendida en estadstica y muchos test estadsticos estn basados en
una "normalidad" ms o menos justificada de la variable aleatoria bajo estudio.
En probabilidad, la distribucin normal aparece como el lmite de varias
distribuciones de probabilidad continuas y discretas.

3.2. Distribucin normal estndar

3.2.1. Curva Normal Estndar

3.2.2 Calculo de reas bajo la curva normal estndar

3.2.3. Teorema de tchebyshef y regla empirica

3.3 Muestreo
En estadstica se conoce como muestreo a la tcnica para la seleccin de una muestra a partir
de una poblacin.

Al elegir una muestra aleatoria se espera conseguir que sus propiedades sean extrapolables a
la poblacin. Este proceso permite ahorrar recursos, y a la vez obtener resultados parecidos a
los que se alcanzaran si se realizase un estudio de toda la poblacin.
Cabe mencionar que para que el muestreo sea vlido y se pueda realizar un estudio
adecuado (que consienta no solo hacer estimaciones de la poblacin sino estimar tambin los
mrgenes de error correspondientes a dichas estimaciones), debe cumplir ciertos requisitos.
Nunca podremos estar enteramente seguros de que el resultado sea una muestra
representativa, pero s podemos actuar de manera que esta condicin se alcance con una
probabilidad alta.
En el muestreo, si el tamao de la muestra es ms pequeo que el tamao de la poblacin, se
puede extraer dos o ms muestras de la misma poblacin. Al conjunto de muestras que se
pueden obtener de la poblacin se denomina espacio muestral. La variable que asocia a cada
muestra su probabilidad de extraccin, sigue la llamada distribucin muestral.

3.3.1. Tipo de muestreo: aleatorio simple, sistemtico y estratificado.


El muestreo aleatorio simple (M.A.S.) es la tcnica de muestreo en la que todos los
elementos que forman el universo y que, por lo tanto, estn descritos en el marco
muestral, tienen idntica probabilidad de ser seleccionados para la muestra. Sera algo
as como hacer un sorteo justo entre los individuos del universo: asignamos a cada
persona un boleto con un nmero correlativo, introducimos los nmeros en una urna y
empezamos a extraer al azar boletos. Todos los individuos que tengan un nmero extrado
de la urna formaran la muestra. Obviamente, en la prctica estos mtodos pueden
automatizarse mediante el uso de ordenadores.

Muestreo sistemtico
Se utiliza cuando el universo o poblacin es de gran tamao, o ha de extenderse en el tiempo.
Primero hay que identificar las unidades y relacionarlas con el calendario (cuando proceda).
Luego hay que calcular una constante, denominada coeficiente de elevacin:
K= N/n
Donde N es el tamao de la poblacin y n el tamao de la muestra.

Para determinar en qu fecha se producir la primera extraccin, hay que elegir al azar un

nmero entre 1 y K; de ah en adelante tomar uno de cada K a intervalos regulares.


Ocasionalmente, es conveniente tener en cuenta la periodicidad del fenmeno.
Esto quiere decir que si tenemos un determinado nmero de personas que es la poblacin (N)
y queremos escoger de esa poblacin un nmero ms pequeo el cual es la muestra (n),
dividimos el nmero de la poblacin por el nmero de la muestra que queremos tomar y el
resultado de esta operacin ser el intervalo, entonces escogemos un nmero al azar desde
uno hasta el nmero del intervalo, y a partir de este nmero escogemos los dems siguiendo
el orden.
Muestreo estratificado
Consiste en la divisin previa de la poblacin de estudio en grupos o clases que se suponen
homogneos con respecto a alguna caracterstica de las que se van a estudiar. A cada uno de
estos estratos se le asignara una cuota que determinara el nmero de miembros del mismo
que compondrn la muestra. Dentro de cada estrato se suele usar la tcnica de muestreo
sistemtico, una de las tcnicas de seleccin ms usadas en la prctica.
Segn la cantidad de elementos de la muestra que se han de elegir de cada uno de los
estratos, existen dos tcnicas de muestreo estratificado:

Asignacin proporcional: el tamao de la muestra dentro de cada estrato es


proporcional al tamao del estrato dentro de la poblacin.

Asignacin ptima: la muestra recoger ms individuos de aquellos estratos que


tengan ms variabilidad. Para ello es necesario un conocimiento previo de la poblacin.

Por ejemplo, para un estudio de opinin, puede resultar interesante estudiar por separado las
opiniones de hombres y mujeres pues se estima que, dentro de cada uno de estos grupos,
puede haber cierta homogeneidad. En la asignacin proporcional, si la poblacin est
compuesta de un 55% de mujeres y un 45 % de hombres, se tomara una muestra que
contenga tambin esos mismos porcentajes de hombres y mujeres. En la asignacin ptima,
si todos los hombres piensan igual, pero las mujeres son impredecibles, se tomara una
muestra con ms del 55% de mujeres.
Para una descripcin general del muestreo estratificado y los mtodos de inferencia asociados
con este procedimiento, suponemos que la poblacin est dividida en hsubpoblaciones o
estratos de tamaos conocidos N1, N2,..., Nh tal que las unidades en cada estrato sean
homogneas respecto a la caracterstica en cuestin. La media y la varianza desconocidas
para el i-simo estrato son denotadas por mi y si2, respectivamente.

3.4 Distribuciones muestrales


El estudio de determinadas caractersticas de una poblacin se efecta a travs
de diversas muestras que pueden extraerse de ella.
El muestreo puede hacerse con o sin reposicin, y la poblacin de partida puede
ser infinita o finita. Una poblacin finita en la que se efecta muestreo con
reposicin puede considerarse infinita tericamente. Tambin, a efectos prcticos,
una poblacin muy grande puede considerarse como infinita. En todo nuestro
estudio vamos a limitarnos a una poblacin de partida infinita o a muestreo con
reposicin.
Consideremos todas las posibles muestras de tamao n en una poblacin. Para
cada muestra podemos calcular un estadstico (media, desviacin tpica,
proporcin,...) que variar de una a otra. As obtenemos una distribucin del
estadstico que se llama distribucin muestral.
Las dos medidas fundamentales de esta distribucin son la media y la desviacin
tpica, tambin denominada error tpico.
Hay que hacer notar que si el tamao de la muestra es lo suficientemente grande
las distribuciones mustrales son normales y en esto se basarn todos los
resultados que alcancemos.
3.4.1 Teorema del lmite central
El Teorema Central del Lmite dice que si tenemos un grupo
numeroso de variables independientes y todas ellas siguen el mismo
modelo de distribucin (cualquiera que ste sea), la suma de ellas se
distribuye segn una distribucin normal.

Ejemplo: la variable "tirar una moneda al aire" sigue la distribucin de


Bernouilli. Si lanzamos la moneda al aire 50 veces, la suma de estas 50

variables (cada una independiente entre s) se distribuye segn una


distribucin normal.

Este teorema se aplica tanto a suma de variables discretas como de


variables continuas.

Los parmetros de la distribucin normal son:

Media: n * m (media de la variable individual multiplicada por el


nmero de variables independientes)
Varianza: n * s2 (varianza de la variable individual multiplicada por el
nmero de variables individuales)

Veamos un ejemplo:
Se lanza una moneda al aire 100 veces, si sale cara le damos el valor 1
y si sale cruz el valor 0. Cada lanzamiento es una variable independiente
que se distribuye segn el modelo de Bernouilli, con media 0,5 y
varianza 0,25.
Calcular la probabilidad de que en estos 100 lanzamientos salgan ms
de 60 caras.
La variable suma de estas 100 variables independientes se distribuye,
por tanto, segn una distribucin normal.

Media = 100 * 0,5 = 50

Varianza = 100 * 0,25 = 25

Para ver la probabilidad de que salgan ms de 60 caras calculamos la


variable normal tipificada equivalente:

(*) 5 es la raz cuadrada de 25, o sea la desviacin tpica de esta


distribucin
Por lo tanto:

P (X > 60) = P (Y > 2,0) = 1- P (Y < 2,0) = 1 - 0,9772 = 0,0228

Es decir, la probabilidad de que al tirar 100 veces la moneda salga ms


de 60 caras es tan slo del 2,28%

3.4.2. Distribucin muestral de medias


Si tenemos una muestra aleatoria de una poblacin N(, ), se sabe (Teorema del
lmite central) que la fdp de la media muestral es tambin normal con media y
varianza 2/n. Esto es exacto para poblaciones normales y aproximado (buena
aproximacin con n>30) para poblaciones cualesquiera. Es decir
tpico, o error estndar de la media.

es el error

Cmo usamos esto en nuestro problema de estimacin?


1 problema: No hay tablas para cualquier normal, slo para la normal=0 y =1 (la
llamada z); pero haciendo la transformacin (llamada tipificacin)

una normal de media y desviacin se transforma en una z.

Llamando z al valor de una


variable normal tipificada que
deja a su derecha un rea bajo la
curva de, es decir, que la
probabilidad que la variable sea
mayor que ese valor es (estos
son los valores que ofrece la tabla
de la normal)

podremos construir intervalos de


la forma

Para los que la probabilidad es 1


- .

Teniendo en cuenta la simetra de la normal y manipulando algebraicamente

Que tambin se puede escribir

O, haciendo nfasis en que

es el error estndar de la media,

Recurdese que la probabilidad de que est en este intervalo es 1 - . A un intervalo


de este tipo se le denomina intervalo de confianza con un nivel de confianza del 100(1
- ) %, o nivel de significacin de 100%. El nivel de confianza habitual es el 95%, en
cuyo caso =0,05 y z /2=1,96. Al valor
que

se le denomina estimacin puntual y se dice

es un estimador de .

Ejemplo: Si de una poblacin normal con varianza 4 se extrae una muestra aleatoria
de tamao 20 en la que se calcula
se puede decir que tiene una probabilidad
de 0,95 de estar comprendida en el intervalo

Que sera el intervalo de confianza al 95% para


En general esto es poco til, en los casos en que no se conoce tampoco suele
conocerse 2; en el caso ms realista de 2 desconocida los intervalos de confianza se
construyen con la t de Student (otra fdpcontinua para la que hay tablas) en lugar de
la z.

O, haciendo nfasis en que

es el error estndar estimado de la media,

Esta manera de construir los intervalos de confianza slo es vlida si la variable es


normal. Cuando n es grande (>30) se puede sustituir t por zsin mucho error.

3.4.3. Distribucin muestral de proporciones


En numerosas ocasiones se plantea estimar una proporcin o porcentaje. En
estos casos la variable aleatoria toma solamente dos valores diferentes (xito o
fracaso), es decir sigue una distribucin binomial y cuando la extensin de la
poblacin es grande la distribucin binomial B(n,p) se aproxima a la normal .
Para muestras de tamao n>30, la distribucin muestral de proporciones sigue
una distribucin normal donde p es la proporcin de uno de los valores que
presenta la variable estadstica en la poblacin y q=1-p.

You might also like