You are on page 1of 57

www.monografias.com AUTOR: MAGALLY ROSARIO DE LA CRUZ MACHUCA mrdm20@hotmail.

com
ALUMNA DE LA MAESTRIA EN “SALUD PÚBLICA CON MENCIÓN EN SALUD REPRODUCTIVA”
UNIVERSIDAD NACIONAL FEDERICO VILLARREAL.

Distribución de probabilidades discretas


PROBLEMA
Hay una campaña en un centro médico del poblado de Ucayali, sobre paternidad responsable
a un grupo de mujeres. Una vez finalizada la charla se les entrega un papelito con una única
pregunta:
¿Desearía usted ser esterilizada?
1. Si 2. No

Usted alumna de la maestría en Salud Publica con mención en Salud Reproductiva, está
interesada en investigar si las charlas tienen un efecto favorable en el sentido de que las
mujeres se decidan a ser sometidas a la esterilización.
Ante este tipo de situaciones en la cual uno se encuentra todos los días, tenemos que acudir
a las Distribuciones de Probabilidades. En nuestro ejemplo, la variable Deseo ser
esterilizada, es una variable cualitativa, discreta. Por lo tanto se requieren de las
Distribuciones de Probabilidades Discretas. Que es la que estudiaremos en este trabajo.

VARIABLE ALEATORIA
Una variable se dice que es aleatoria, si los posibles valores que puede tomar son
determinados por el azar. En otras palabras se sabe qué valores puede tomar la variable
pero no se tiene certeza de su ocurrencia, sólo se sabe que puede ocurrir con una cierta
probabilidad. Por ejemplo, en una epidemia de cólera, se sabe que una persona cualesquiera
puede enfermar o no (eventos), pero no se sabe cuál de los dos eventos va a ocurrir.
Solamente se puede decir que existe una probabilidad de que la persona enferme.
Las variables aleatorias se clasifican:
1. Discretas: aquellas que resultan de contar el número de casos en los que el evento de
interés ocurre, por ejemplo: número de hijos de una familia, número de veces que llega
una paciente al servicio de emergencia, etc.
2. Continuas: aquellas que resultan producto de una medición, por ejemplo: el peso, el
nivel de hemoglobina, etc.

DISTRIBUCION DE PROBABILIDADES DISCRETAS


Sigamos con nuestro ejemplo del centro médico de departamento de Ucayali. Nuestra
variable de interés seria:
Deseo ser esterilizada.
Supongamos que a la charla asistieron tres mujeres, entonces definimos como variable
aleatoria a:
X: Número de mujeres que desearían ser esterilizadas.

Antes de hacerles la pregunta sobre su deseo de ser esterilizadas, puede considerar las
posibles respuestas:
X = 0  Ninguna desearía ser esterilizada
X = 1  Sólo una de las mujeres desearía
X = 2  Dos mujeres desearían
X = 3  Las tres mujeres desearían

Antes de verificar las respuestas de las 3 mujeres seleccionada; no sabe cuántas estarán de
acuerdo en ser esterilizadas, pero si conociera las probabilidades de ocurrencia de cada uno
de los posibles valores de la variable podría predecir su ocurrencia con una cierta
probabilidad. El conjunto de las probabilidades de ocurrencia de los posibles valores de la
variable aleatoria se denomina distribución de probabilidades.

En nuestro ejemplo:
X Probabilidad
0 0.125
1 0.375
2 0.375
3 0.125
A esto se le llama distribución de probabilidades discreta. Discreta porque la variable
X deseo ser esterilizada es discreta.

Nosotros estudiaremos dos tipos de distribuciones de probabilidades discretas: la Binomial


y la de Poisson, para su solución, utilizaremos las matemáticas y también el Excel.
www.ieszaframagon.com/matematicas/estadistica/...aleatoria/tema5_2.ht...
1. DISTRIBUCIÓN DE PROBABILIDAD PARA VARIABLES ALEATORIAS
DISCRETAS.

1.1.-VARIABLES ALEATORIAS

Partimos de un determinado experimento y de su espacio muestral asociado E. Una variable


aleatoria es una aplicación, que al cualquier suceso del espacio muestral le asocia un
número. O sea, para hablar de variable aleatoria, nuestro experimento tiene que ser de tal
forma que cada posible suceso o resultado se pueda expresar mediante un número.

Ejemplos de variables aleatorias:

 Puntuación obtenida al lanzar un dado. Es una variable aleatoria pues cada posible
resultado se puede expresar mediante un número.
 Edad de una persona elegida al azar.
 Altura de un árbol.
 Número de caras al lanzar tres monedas.
 Número de personas en una muestra de 50 que comen frutas habitualmente.

No son variables aleatorias:

 Sacar una prenda dentro de un cajón.


 Sacar una bola de una urna que contiene bolas blancas, negras y verdes.
 Elegir una persona al azar que le guste el teatro o no.

En los últimos ejemplos, tal como están planteados no serían variables aleatorias, pero a
veces podemos asociarles valores para que sí lo sean. Por ejemplo, si yo digo que el suceso
"le gusta el teatro" vale 1 y el suceso "no le gusta el teatro" vale 0, ya tendría definida una
variable aleatoria sobre el experimento elegir una persona, que valdría 1 si le gusta el teatro
y 0 si no le gusta.

El concepto de variable aleatoria surge ante la necesidad de cuantificar los resultados de los
experimentos aleatorios para poder realizar un estudio matemático de dichos resultados.

El concepto de variable aleatoria y variable estadística es muy similar, solo que en variables
estadísticas contamos y partimos de datos concretos, mientras que en variables aleatorias
partimos de lo que puede pasar antes de realizar el experimento.

Así pues, con variables aleatorias, también hacemos la división en discretas y continuas, las
representamos con los mismos gráficos y podemos calcular los mismos parámetros. La
diferencia estribará en que en las variables estadísticas miramos las frecuencias (absolutas
o relativas) y en las variables aleatorias miraremos las probabilidades de ocurrencia de cada
suceso.
1.2.-VARIABLES ALEATORIAS DISCRETAS

Una variable aleatoria se dirá discreta si el conjunto de valores que toma es un conjunto
numerable, es decir, que sólo puede tomar unos valores concretos. Dicho conjunto lo
denotaremos por: {x1, x2, x3,...., si}

Toda variable aleatoria discreta tiene asociada una función de probabilidad, que a cada valor,
le marca la probabilidad de que la variable tome dicho valor. Esta probabilidad viene a jugar
el mismo papel que la frecuencia relativa en los temas de estadística.

Ejemplo 1: Obtener la función de probabilidad de la variable "puntuación obtenida al lanzar


un dado".
Valores Función de
Definimos la variable aleatoria X= puntuación obtenida. de la probabilidad
variable pi = P[𝑋 = 𝑥i]
Los posibles resultados son: 1, 2, 3, 4, 5 y 6 y todos esos valores Xi
tienen una probabilidad de 1 / 6. 1 1
6
Si ponemos en forma de tabla los resultados, la función de 2 1
probabilidad quedaría: 6
3 1
6
4 1
6
5 1
6
6 1
6
Ejemplo 2: Obtener la función de probabilidad de la variable "número de caras obtenidas al
lanzar tres monedas"

Antes que nada, vamos al construir el espacio muestral del experimento lanzar tres monedas.
Éste sería:

E = {(c,c,c); (c,x,c); (x,c,c); (c,c,x); (c,x,x,); (x,c,x); (x,x,c); (x,x,x)}

Si definimos X = nº de caras obtenidas, vemos que los posibles valores son: 0, 1, 2 y 3; y la


función de probabilidad será:
Como puedes observar en los dos
xi 0 1 2 3 ejemplos, la suma de todas las
probabilidades tiene que ser 1, pues
1/8 = 3/8 = 3/8 = 1/8 =
pi estaríamos considerando el espacio
0.125 0.375 0.375 0.125
muestral completo
Parámetros de una variable aleatoria
La ventaja de trabajar con variables aleatorias es que podemos hacer cálculos que adquieren
significado sobre el comportamiento de la variable. En una variable aleatoria, podemos
calcular todos los parámetros que habíamos visto en la estadística unidimensional: media,
varianza moda, mediana, percentiles, desviaciones, etc., aunque nosotros vamos a
centrarnos en las dos primeras, la media y la varianza, (bueno o la desviación típica que era
la raíz de la varianza si recuerdas)

MEDIA: La media de una variable aleatoria se llama ESPERANZA MATEMÁTICA, se


representa por E(X) o por µ y viene a darnos el "valor esperado" de la variable al realizar el
experimento aleatorio. La fórmula para calcularla es

VARIANZA: El significado es el mismo que en la estadística. Aporta una medida sobre la


dispersión de los valores de X. Para calcularla usamos una de las dos fórmulas, aunque es
más aconsejable la segunda:

Veamos un par de ejemplos:


Ejemplo: Calcula la media y la varianza de la variable del Ejemplo 1

Valores Función de
de la probabilidad
variable pi = P[𝑋 =
Lo que significa que el valor esperado en el Xi 𝑥i]
1 1
lanzamiento de un dado es 3,5
6
2 1
6
3 1
6
Y si queremos calcular la desviación típica, haríamos la raíz 4 1
cuadrada de ese resultado y obtendríamos, 1.708
6
5 1
6
Ejemplo: Calcula la esperanza y la varianza de la variable número 6 1
de caras del ejemplo 2 6

xi 0 1 2 3
1/8 =
pi 3/8 = 0.375 3/8 = 0.375 1/8 = 0.125
0.125
E(X) =0·0,125 + 1·0,375 + 2·0,375 + 3·0,125 = 1,5.

Luego el número de caras esperado en el lanzamiento de tres monedas es una y media.

Var (X) =(02·0,125 + 12·0,375 + 2 2·0,375 + 32·0,125 ) - 1.52 = 3 - 2.25 = 0.75

Ejercicios
1.- En la siguiente tabla se presenta la distribución del número de hijos de un grupo de 100
parejas:
Nº de hijos 0 1 2 3 4 5 7
Nº de parejas 15 40 23 10 7 4 1

a. Obtener la función de probabilidad de la variable aleatoria nº de hijos


b. ¿Cuál es la probabilidad de una pareja elegida al azar tenga menos de dos hijos?
c. ¿Cuál es la probabilidad de que tenga más de tres hijos?
d. Si se elige un hijo al azar, ¿cuál es la probabilidad de que no tenga hermanos?
e. Determina el número de hijos esperado al seleccionar una familia al azar.
f. Calcula la varianza de la variable.

2.- Una variable aleatoria discreta tiene la siguiente función de probabilidad:

Xi -2 -1 0 1 2 3
pi 0.08 0.21 0.1 0.23 0.04

a. Calcula el dato que falta.


b. Halla la media y la desviación típica.
c. Calcula P[X > 1] y P[ -1.5 < X < 2]

3.- ¿Cuál es el dinero que espera ganar un jugador que lanza dos dados de quinielas (o sea,
solo con tres caras, 1, X y 2) y recibe 90 dólares si salen dos doses; 45 dólares si sale un
dos y paga 81 dólares si no sale dos?
VALOR ESPERADO
Se llama también esperanza matemática. Se trata de un operador matemático que al ser
aplicado a la función probabilidad permite el cálculo de ese valor en el caso discreto, mientras
que en el caso continuo se lo aplica a la función frecuencia.

Esperanza matemática

En estadística la esperanza matemática (también llamada esperanza, valor esperado,


media poblacional o media) de una variable aleatoria , es el número que formaliza
la idea de valor medio de un fenómeno aleatorio.

Cuando la variable aleatoria es discreta, la esperanza es igual a la suma de la probabilidad


de cada posible suceso aleatorio multiplicado por el valor de dicho suceso. Por lo tanto,
representa la cantidad media que se "espera" como resultado de un experimento aleatorio
cuando la probabilidad de cada suceso se mantiene constante y el experimento se repite un
elevado número de veces. Cabe decir que el valor que toma la esperanza matemática en
algunos casos puede no ser "esperado" en el sentido más general de la palabra - el valor de
la esperanza puede ser improbable e incluso imposible.

Por ejemplo, el valor esperado cuando tiramos un dado equilibrado de 6 caras es 3,5.
Podemos hacer el cálculo

La esperanza matemática o valor esperado de una variable aleatoria discreta es la suma


del producto de la probabilidad de cada suceso por el valor de dicho suceso.

Los nombres de esperanza matemática y valor esperado tienen su origen en los juegos
de azar y hacen referencia a la ganancia promedio esperada por un jugador cuando hace
un gran número de apuestas.

Si la esperanza matemática es cero, E(x) = 0, el juego es equitativo, es decir, no existe


ventaja ni para el jugador ni para la banca.

Ejemplos
1 Si una persona compra una papeleta en una rifa, en la que puede ganar de 5.000 dólares
o un segundo premio de 2000 dólares con probabilidades de: 0.001 y 0.003. ¿Cuál sería el
precio justo a pagar por la papeleta?
E(x) = 5000 · 0.001 + 2000 · 0.003 = 11 dólares

2 Un jugador lanza dos monedas. Gana 1 o 2 pesos si aparecen una o dos caras. Por otra
parte pierde 5 pesos si no aparece cara. Determinar la esperanza matemática del juego y
si éste es favorable.

E = {(c,c);(c,x);(x,c);(x,x)}

p(+1) = 2/4

p(+2) = 1/4

p(−5) = 1/4

E(x)= 1 · 2/4 + 2 · 1/4 - 5 · 1/4 = −1/4. Es desfavorable

Esperanza matemática o media Varianza

Desviación típica

Calcular la esperanza matemática, la varianza, y la desviación típica, de la distribución de


probabilidad de las puntuaciones obtenidas al lanzar un dado.

x pi x·pi x 2 · pi

6 1 6
DISTRIBUCION BINOMIAL
Esta distribución se basa en el proceso de Bernoulli. Se denominan procesos de tipo
Bernoulli, a todo experimento consistente en una serie de pruebas repetidas,
caracterizadas por tener resultados que se pueden clasificar en si verifican o no cierta
propiedad o atributo, siendo aleatorios e independientes.
Para identificar un proceso Bernoulli en una serie de pruebas repetidas, se deben verificar
tres condiciones:
1. Resultados dicotómicos: Los resultados de cada prueba se pueden clasificar en
“éxito” si verifican cierta condición, o “fracaso” en el caso contrario.
2. Independencia de las pruebas: El resultado de una prueba cualquiera es
independiente del resultado obtenido en la prueba anterior, y no incide en el resultado
de la prueba siguiente.
3. Estabilidad de las pruebas: La probabilidad p de obtener un resultado considerado
como un éxito se mantiene constante a lo largo de toda la serie de pruebas.
Cuando en un proceso del tipo Bernoulli se desea saber la probabilidad de obtener
exactamente r éxitos, en una serie de n pruebas, con una probabilidad de éxito p, se puede
aplicar la fórmula de la probabilidad binomial:

n x
P( x)    p (1  p) n  x
 x

X = 0, 1, 2,……, n.

n n!
  
 x  (n  x)! x!

La media o valor esperado es  = np


La varianza 2 = np (1-p)

Supongamos que un experimento aleatorio tiene las siguientes características:


 El experimento aleatorio consiste en repetir un cierto número de veces, "n", una
determinada prueba.
 En cada prueba del experimento, sólo son posibles dos resultados: el suceso A, que
llamaremos éxito y su complementario, llamado fracaso.
 El resultado de cada prueba es independiente de los resultados obtenidos
anteriormente, es decir, el resultado obtenido en la primera prueba, no influye para
nada en el posible resultado de la segunda o la tercera.
 La probabilidad de que ocurra el éxito es siempre la misma y la expresaremos como
"p", y por tanto, la probabilidad de fracaso será q = 1 - p.

Todo experimento aleatorio con estas características se dice que sigue el modelo de la
distribución binomial, y a la variable X que expresa el número de éxitos obtenidos en las n
repeticiones de la prueba, se le llama variable aleatoria binomial y se representa por B(n,
p); donde "n" es el número de repeticiones de la prueba y "p" la probabilidad de éxito.

Ejemplos de variables que siguen una distribución binomial:

 Número de caras al lanzar 7 monedas.


 Número de piezas defectuosas que fabrica una máquina.
 Número de tachuelas que al caer quedan de punta.

Veamos cómo calcular la probabilidad de los distintos valores de X con un ejemplo:


"Un examen tipo test consta de 10 preguntas, cada una de ellas con tres posibles respuestas,
de forma que sólo una de las tres es correcta. ¿Cuál es la probabilidad de que un estudiante
que contesta al azar acierte 6?"

Definimos X = "Número de aciertos en las 10 preguntas". En este caso, cada pregunta es


cada una de las pruebas que se repiten, o sea, n = 10.

De la manera que está planteado el problema sólo hay dos posibles resultados, o acierta
(éxito, pues me preguntan sobre los aciertos) o no acierta (fracaso) y la probabilidad de
acierto en cada prueba es la misma, 1 / 3.

Por tanto efectivamente X sigue una distribución binomial;


X es B (10, 1/3) y el problema me pide P [X = 6]

Para calcular esa probabilidad, observamos que X = 6 significa 6 aciertos y 4 fallos, o sea (1
/ 3) 6 · (2 / 3) 4. Además hay que tener en cuenta cómo repartir los 6 aciertos a lo largo de las
10 preguntas; no importa el orden y no se pueden repetir las preguntas, por tanto
combinación sin repetición de 10 elementos tomados de 6 en 6.Luego la probabilidad pedida
es:
General, si X sigue una distribución B(n, p), la función de probabilidad viene dada por la
fórmula:

Donde, n, debe ser un entero positivo y p debe pertenecer al intervalo 0 ≤ p ≤ 1, por ser
una proporción. Su media y su varianza, vendrán dadas por las siguientes expresiones

El cálculo de la media y la varianza de una distribución binomial es inmediato si conocemos


sus parámetros n y p. Haciendo cálculos se llega a que:

Esperanza: E(X) = n*p

Varianza: Var(X) = n*p*q; donde q = 1- p, o sea, la probabilidad de fracaso.

Var(X) = n*p*(1 – p)

Ejercicios TAREA

*Todos los ejercicios hay que empezarlos definiendo una variable y relacionando la
probabilidad pedida con valores de la variable.

1.- La probabilidad de que una pieza fabricada por una empresa sea defectuosa es 0.1. Halla
la probabilidad de que en una muestra de 100 piezas se encuentren tres defectuosas.

2.- La probabilidad de que un estudiante de primero de la licenciatura de física obtenga el


título es de 0.2. Halla la probabilidad de que en un grupo de 8 alumnos de primer curso, al
menos dos acaben la carrera. ¿Cuál es la probabilidad de que no lo acabe ninguno?

3.- El 60% de los licenciados de una facultad encuentran trabajo el primer año después de
acabar la carrera. De los 150 licenciados en un curso, ¿cuántos se espera que se coloque
en el primer año? ¿Cuál es la desviación típica?

4.- Un laboratorio ha comprobado que el 25% de los que toman un determinado antibiótico
sufren efectos secundarios. De una muestra de ocho enfermos que toman dicho antibiótico,
halla la probabilidad de que sufran efectos secundarios:

a. Al menos seis
b. Más de dos
c. Menos de la mitad
d. A lo más 3
e. Todos
f. Halla el número de enfermos esperado con efectos secundarios.

5.- Suponiendo que el 43% de los españoles tengan Rh -, si tomamos una muestra de siete
personas, ¿qué probabilidad hay de que todas sean Rh-? ¿Y de que cuatro sean Rh+?
Características de una B(n, p):

 a.- Repetimos n veces un experimento y se considera si se verifica o no un


determinado suceso.
 b.- La probabilidad de que se verifique dicho suceso se mantiene constante y la
llamamos p.
 c.- Las pruebas son independientes unas de otras.
 d.- La variable X es el número de veces que se verifica dicho suceso y está
comprendido entre 0 y n
 e.- En el eje OX se representan los valores de X y en último paso su probabilidad.

Si p=0.5, la distribución de probabilidad es simétrica.

Si p está próximo a cero, los valores pequeños tienen probabilidad alta y lo mayores
tienen probabilidad prácticamente 0. Es decir, la distribución está tirada a la izquierda.

Si p está próximo a 1, ocurre todo lo contrario que en el punto anterior.

Comprueba que los tres puntos anteriores se cumplen sea cual sea el valor de n.

Una máquina fabrica piezas defectuosas con una probabilidad de 0,05. Calcula la
probabilidad de que al fabricar 20 piezas 6 seis sean defectuosas. ¿Y de que sean 3 las
defectuosas? ¿Y que todas sean buenas?

Veamos el siguiente ejemplo:


Sea el caso de una droga X, con una dosis mortal de 1g/100 ml para cobayos experimentales,
en el 25% de los casos. Aplicando esta dosis a cien cobayos se desea saber cuánto vale la
probabilidad de que mueran veinte de ellos.
Primero analizaremos si este caso cumple los supuestos básicos de una distribución
binomial:
 Los cobayos mueren (éxito) o sobreviven (fracaso).
 Que un cobayo muera con la dosis, no significa que lo hará el siguiente (independencia)
pues no se trata de una epidemia.
 La probabilidad de que mueran se mantiene constante a lo largo de la serie de pruebas
(p = 0,25).

Entonces, como si cumple los supuestos básicos, aplicamos la fórmula:


100  100 20
P( x  20)  
 20 
 (0.25) (1  0.25)
20
 0.04902  4.9%
 
Mucha matemática. No se preocupen, tenemos al Excel

Ingresamos la información y listo P(x=20) = 0.0493


Veamos otro ejemplo:
En una farmacia se ha calculado la probabilidad de venderle a un cliente con obra social es
del 20%. Se eligen al azar 15 clientes de ese tipo que ingresan al negocio y se desea calcular
la probabilidad de concretar menos de tres ventas.
Si se cumple los supuestos básicos de la distribución binomial, entonces:

P(x<3) = P(x=0) + P(x=1) + P(x=2)

Matemáticamente esto se resuelve así:

15 
P( x  0)    (0.20) 0 (1  0.20)150  0.0352
0
15 
P( x  1)    (0.20)1 (1  0.20)151  0.1319
1
15 
P( x  2)    (0.20) 2 (1  0.20)15 2  0.2309
2
Entonces: P(x<3) = 0.0352 + 0.1319 + 0.2309 = 0.398

Ahora los hacemos con el Excel.


Matemáticamente P(x<3) = P (x≤ 2). El Excel calcula siempre o igualdad o menor igual.
Cuando queremos menor igual, en la opción de acumulado ingresamos VERDADERO.

Entonces P(x<3) = 0.398

Gracias Excel, por facilitarme las cosas.


Otros casos de Distribución binomial o de Bernoulli

Un experimento sigue el modelo de la distribución binomial o de Bernoulli si:

1. En cada prueba del experimento sólo son posibles dos resultados: el suceso A (éxito) y su
contrario 𝐴̅
2. La probabilidad del suceso A es constante, es decir, que no varía de una prueba a otra.
Se representa por p.
3. El resultado obtenido en cada prueba es independiente de los resultados obtenidos
anteriormente.

Variable aleatoria binomial


La variable aleatoria binomial, X, expresa el número de éxitos obtenidos en cada prueba del
experimento.
La variable binomial es una variable aleatoria discreta, sólo puede tomar los valores 0, 1, 2,
3, 4,…n

Donde n es el número de pruebas realizadas.

Ejemplo para responder en clase

¿Cuál es la probabilidad de obtener 6 caras al lanzar una moneda 10 veces?

Distribución binomial
La distribución binomial se suele representar por B(n, p).
n es el número de pruebas de que consta el experimento.
p es la probabilidad de éxito.
La probabilidad de es 1− p, y la representamos por q.

Función de probabilidad de la distribución binomial


La función de probabilidad de la distribución binomial, también denominada función de la
distribución de Bernoulli, es:

𝑛
P(X = k) = ( ) ∗ 𝑝𝑘 ∗ 𝑞 𝑛−𝑘
𝑘
n es el número de pruebas (10) k = es el número de éxitos (6).
p es la probabilidad de éxito. (0.5)
q es la probabilidad de fracaso. (1 – 0.5)
𝑛 𝑛!
El número combinatorio ( )=
𝑘 𝑘!(𝑛−𝑘)!

Ejemplo
La última novela de un autor ha tenido un gran éxito, hasta el punto de que el 80% de los
lectores ya la han leído. Un grupo de 4 amigos son aficionados a la lectura:

1. ¿Cuál es la probabilidad de que el grupo hayan leído la novela 2 personas?


n=4 número de lectores
p = 0.8 éxito
q = 0.2 fracaso
B (4, 0.8)

4 4∗3∗2! 12
p(X = 2) = ( ) ∗ 0.82 ∗ 0.24−2 = * 0.64 * .04 = ∗ .64 + .04 = 0.1536
2 2!(2)! 2

2. ¿Y cómo máximo 2?
p(x ≤ 2) = p(x = 0) + p(x = 1) + p(x = 2)

4 4 4
= ( ) ∗ 0.80 ∗ 0.24 + ( ) ∗ 0.81 ∗ 0.23 + ( ) ∗ 0.82 ∗ 0.22 = 0.1808
0 1 2
Media, varianza y desviación típica de la distribución binomial

Media µ=n*p

Varianza σ2 = n * p * q

Desviación típica σ √𝑛 ∗ 𝑝 ∗ 𝑞

Ejemplo
La probabilidad de que un artículo producido por una fábrica sea defectuoso es 0.02. Se
envió un cargamento de 10.000 artículos a unos almacenes. Hallar el número esperado de
artículos defectuosos, la varianza y la desviación típica.

µ=n*p 10,000 * 0.02 = 200

σ2 = n * p * q 10,000 * 0.02 * 0.98 = 196

σ √𝑛 ∗ 𝑝 ∗ 𝑞 √10,000 ∗ 0.02 ∗ 0.98 = √196 = 14

DISTRIBUCIÓN HIPERGEOMÉTRICA.

Los experimentos que tienen este tipo de distribución tienen las siguientes características:

a) Al realizar un experimento con este tipo de distribución, se esperan dos tipos de


resultados.
b) Las probabilidades asociadas a cada uno de los resultados no son constantes.
c) Cada ensayo o repetición del experimento no es independiente de los demás.
d) El número de repeticiones del experimento (n) es constante.
Ejemplo:

En una urna o recipiente hay un total de N objetos, entre los cuales hay una cantidad a de
objetos que son defectuosos, si se seleccionan de esta urna n objetos al azar, y sin
reemplazo, ¿cuál es la probabilidad de obtener x objetos defectuosos?

Solución:

𝐶𝑥𝑎 ∗ 𝐶𝑛−𝑥
𝑁−𝑎
p(x,n) = =
𝑐
Donde: p(x,n) = probabilidad de obtener x objetos defectuosos de entre n seleccionados

𝐶𝑥𝑎 ∗ 𝐶𝑛−𝑥
𝑁−𝑎
Muestras de n objetos en donde hay x que son defectuosos y n-x buenos

𝐶𝑥𝑎 ∗ 𝐶𝑛−𝑥
𝑁−𝑎
= S= Todas las muestras posibles de seleccionar de n objetos
tomadas de entre N objetos en total = espacio muestral

Considerando que en la urna hay un total de 10 objetos, 3 de los cuales son defectuosos, si
se seleccionan 4 objetos al azar, ¿cuál es la probabilidad de que 2 sean defectuosos?

Solución:

N = 10 objetos en total
a = 3 objetos defectuosos
n = 4 objetos seleccionados en muestra
x = 2 objetos defectuosos deseados en la muestra

Donde: Probabilidad asociada a cada muestra de 4 objetos que se


seleccionaron, con lo que se demuestra que las probabilidades no
son constantes
Formas o maneras de obtener 2 objetos defectuosos entre los 4 seleccionados =
muestras de 4 objetos entre los que 2 son defectuosos

Como se observa en el desarrollo de la solución del problema, la pretensión es demostrar


que las probabilidades asociadas a cada uno de los resultados no son constantes.

Luego la probabilidad de obtener 2 objetos defectuosos entre los 4 seleccionados al azar


sería:

Ejemplos:

1. Para evitar que lo descubran en la aduana, un viajero ha colocado 6 tabletas de


narcótico en una botella que contiene 9 píldoras de vitamina que son similares en apariencia.
Si el oficial de la aduana selecciona 3 tabletas aleatoriamente para analizarlas, a) ¿Cuál es
la probabilidad de que el viajero sea arrestado por posesión de narcóticos?, b) ¿Cuál es la
probabilidad de que no sea arrestado por posesión de narcóticos?

Solución:

a) N = 9 + 6 =15 total de tabletas

a = 6 tabletas de narcótico

n = 3 tabletas seleccionadas

x = 0, 1, 2, o 3 tabletas de narcótico = variable que nos indica el número de tabletas de


narcótico que se puede encontrar al seleccionar las 3 tabletas

p (viajero sea arrestado por posesión de narcóticos) = p (de que entre las 3 tabletas
seleccionadas haya 1 o más tabletas de narcótico)

Otra forma de resolver;

p (el viajero sea arrestado por posesión de narcóticos) = 1 – p (de que entre las tabletas
seleccionadas no haya una sola de narcótico)
b) p (no sea arrestado por posesión de narcóticos)

2. De un lote de 10 proyectiles, 4 se seleccionan al azar y se disparan. Si el lote contiene 3


proyectiles defectuosos que no explotarán, ¿cuál es la probabilidad de que, a) los 4
exploten?, b) ¿al menos 2 no exploten?

Solución:

a) N = 10 proyectiles en total

a = 7 proyectiles que explotan

n = 4 proyectiles seleccionados

x = 0, 1, 2, 3 o 4 proyectiles que explotan = variable que nos define el número de proyectiles


que explotan entre la muestra que se dispara

b) N = 10 proyectiles en total
a = 3 proyectiles que no explotan
n = 4 proyectiles seleccionados
x = 0, 1, 2 o 3 proyectiles que no explotan
p(al menos 2 no exploten) = p (2 o más proyectiles no exploten) = p(x = 2 o 3; n=4) =
a)¿Cuál es la probabilidad de que una mesera se rehúse a servir bebidas alcohólicas
únicamente a dos menores de edad si verifica aleatoriamente sólo 5 identificaciones de entre
9 estudiantes, de los cuales 4 no tienen la edad suficiente?

N = 9 total de estudiantes
a = 4 estudiantes menores de edad
n = 5 identificaciones seleccionadas
x = variable que nos define el número de identificaciones que pertenecen a personas
menores de edad
x = 0, 1, 2, 3 o 4 identificaciones de personas menores de edad

corregir
b) ¿Cuál es la probabilidad de que como máximo 2 de las identificaciones pertenezcan a
menores de edad?

N = 9 total de estudiantes
a = 4 estudiantes menores de edad
n = 5 identificaciones seleccionadas
x = variable que nos define el número de identificaciones que pertenecen a personas
menores de edad
x = 0, 1, 2, 3 o 4 identificaciones de personas menores de edad

4. Una compañía manufacturera utiliza un esquema para la aceptación de los artículos


producidos antes de ser embarcados. El plan es de dos etapas. Se preparan cajas de 25
para embarque y se selecciona una muestra de 3 para verificar si tienen algún artículo
defectuoso. Si se encuentra uno, la caja entera se regresa para verificarla al 100%. Si no se
encuentra ningún artículo defectuoso, la caja se embarca.

a) ¿Cuál es la probabilidad de que se embarque una caja que tiene tres artículos
defectuosos?

b) ¿Cuál es la probabilidad de que una caja que contiene sólo un artículo defectuoso se
regresa para verificación?
1.5. DISTRIBUCIÓN POISSON

Mendoza, H, Bautista, G. (2002). Probabilidad y Estadística. Universidad Nacional de


Colombia, http://www.virtual.unal.edu.co/cursos/ciencias/2001065/. Licencia: Creative
Commons BY-NC-ND.

La distribución de Poisson parte de la distribución binomial.

Introducción

Llamada así por su autor Simeón Denis Poisson, probabilista del siglo XIX, pues fue el
primero en describirla. Es una generalización de la distribución binomial cuando sobre un
. Se define una variable aleatoria que representa el número de éxitos independientes
que ocurren para intervalos de medida específicos (tiempos, lugares, espacios), además
con una probabilidad de ocurrencia pequeña.

Se le llama distribución de los "eventos raros" pues se usa como aproximación a la


binomial cuando el tamaño de muestra es grande y la proporción de éxitos es pequeña.

Esos intervalos de medida pueden referirse a: Tiempo: (Segundo, minuto, hora, día,
semana, etc.) Área: (Segmento de línea, pulgada cuadrada, Centímetro cuadrado, etc.).
Volumen:( Litro, galón, onza, etc.)

Ejemplo

 Número de defectos por .en piezas similares de un material ...


 Número de personas que llegan a un taller automotriz en un lapso de tiempo
específico.
 Número de impulsos electrónicos errados transmitidos durante espacio de tiempo
específico.
 Número de llamadas telefónicas que ingresan a un conmutador por minuto.
 Número de interrupciones en servicios de energía en intervalos de un día.
 Cantidad de átomos que se desintegran en sustancia radioactiva.
 Número de accidentes automovilísticos en un cruce específico durante una semana.

Criterios o propiedades

1. Se da un intervalo de medida que divide un todo de números reales y donde el


conteo de ocurrencias es aleatorio. Esa división puede ser un subintervalo de
medida.
2. El número de ocurrencias o de resultados en el intervalo o subintervalo de medida,
es independiente de los demás intervalos o subintervalos. por eso se dice que el
proceso de Poisson no tiene memoria.
3. La probabilidad de que un solo resultado ocurra en un intervalo de medida muy corto
o pequeño es la misma para todos los demás intervalos de igual tamaño y es
proporcional a la longitud del mismo o al tamaño de medida.
4. La probabilidad de que más de un resultado ocurra en un intervalo o subintervalo
corto es tan pequeña que se considera insignificante (cercana o igual a cero).

Procesos que se ajustan a estos criterios, se dice, son procesos de Poisson.

Definición

Sea una variable aleatoria que representa el número de eventos aleatorios


independientes que ocurren con igual rapidez en un intervalo de medida. Se tiene entonces
que la función de probabilidad de esta variable, se expresa por:

Donde es parámetro de tendencia central de la distribución y representa el número


promedio o cantidad esperada de ocurrencias (éxitos) del evento aleatorio por unidad de
medida o por muestra; y Número de ocurrencias específicas para el cual
se desea conocer la probabilidad respectiva. Según sea el valor de , se define toda
una familia de probabilidades de Poisson. La probabilidad de que una variable aleatoria de
Poisson sea menor o igual a un valor de se halla por la función de distribución
acumulativa, planteada entonces como:

Los resultados de las probabilidades individuales para valores de serán más pequeños
conforme la variable aleatoria toma valores cada vez más grandes.

Cuando en una distribución binomial se realiza el experimento un número "n" muy elevado
de veces y la probabilidad de éxito "p" en cada ensayo es reducida, entonces se aplica el
modelo de distribución de Poisson:

Se tiene que cumplir que:

“p " < 0,10

“p * n " < 10

La distribución de Poisson sigue el siguiente modelo:


Vamos a explicarla:

El número "e" es 2,71828

“λ " = n * p (es decir, el número de veces " n " que se realiza el experimento multiplicado
por la probabilidad " p " de éxito en cada ensayo)

“k " es el número de éxito cuya probabilidad se está calculando.

Veamos un ejemplo:

La probabilidad de tener un accidente de tráfico es de 0,02 cada vez que se viaja, si se


realizan 300 viajes, ¿cuál es la probabilidad de tener 3 accidentes?

Como la probabilidad " p " es menor que 0,1, y el producto " n * p " es menor que 10,
entonces aplicamos el modelo de distribución de Poisson.

p = 0.02
λ = (0.02)(300) = 6
e = 2,71828
k=3

63
P(x =3) = e-6 *
3!

Luego,

P (x = 3) = 0,0892

Por lo tanto, la probabilidad de tener 3 accidentes de tráfico en 300 viajes es del 8,9%

Otro ejemplo:

La probabilidad de que un niño nazca pelirrojo es de 0,012. ¿Cuál es la probabilidad de que


entre 800 recién nacidos haya 5 pelirrojos?

9.65
P(x =3) = e-9.6 *
5!

Luego,
P (x = 5) = 4,602

Por lo tanto, la probabilidad de que haya 5 pelirrojos entre 800 recién nacidos es del 4,6%.

Para recordar POISSON


Se denominan procesos de tipo Poisson, a todo experimento consistente en una serie de
pruebas repetidas dentro de un continuo, caracterizadas por tener resultados que se pueden
clasificar en si verifican o no, cierta propiedad o atributo, siendo aleatorios e independientes
del lugar que ocurren dentro del continuo.
Para identificar un proceso Poisson en una serie de pruebas repetidas, se deben verificar
tres condiciones:
1. Sucesos puntuales: Los sucesos ocurren dentro de un continuo (espacio o tiempo) y
ocupan una parte infinitesimal del mismo. Es decir, en el espacio un suceso es puntual
y en el tiempo es instantáneo. En términos prácticos, los sucesos no ocupan una parte
apreciable del continuo.
2. Sucesos independientes: La ocurrencia de un suceso en un lugar del continuo no
condiciona la ocurrencia del anterior (o del siguiente) en otra parte del mismo.
3. Probabilidad constante: La probabilidad de ocurrencia de un suceso en un lugar del
continuo es la misma en todo punto del mismo.

Son ejemplos de este tipo de proceso:


 la llegada de pacientes a una cola o línea de espera,
 los accidentes en una ruta, etc.

Esta probabilidad se aproxima a la binomial cuando la probabilidad de éxito es muy pequeña,


por eso muchos la llaman: la “binomial de los sucesos raros”.

Cuando en un proceso del tipo Bernoulli se desea saber la probabilidad de obtener


exactamente x éxitos en un intervalo de tiempo, con un promedio de eventos esperados  ,
se puede aplicar la fórmula de la probabilidad de Poisson:
e  x
P( x) 
x!

X = 0, 1, 2,…., n

e = 2.71828 (es una constante, la base de los logaritmos naturales)

Veamos el siguiente ejemplo:


Supongamos que estamos investigando la seguridad de una peligrosa intersección de calles,
los registros policíacos indican una media de 5 accidentes mensuales en esta intersección.
El departamento de seguridad vial desea que calculemos la probabilidad de que en cualquier
mes ocurran exactamente 3 accidentes.
Analizando el problema, este situación se ajusta a un proceso de Poisson, hay una secuencia
de llegada (por más que exista un choque múltiple, siempre hay uno que choca primero).
Tenemos la siguiente información:
 = 5 accidentes por mes
x = 3 accidentes por mes

Aplicando la fórmula de la probabilidad de Poisson:

(2.71828) 5 53
P( x  3)   0.1404 14.04%
3!

Ahora lo hacemos con el Excel:


Ingresamos la información y listo P(x=3) = 0.14037
Ahora planteamos otra pregunta:
¿Cuál sería la probabilidad de que sucedan como máximo 2 accidentes en un mes?

En este caso sería: P(x ≤ 2) = P(x=0) + P(x=1) + P(x=2)

Matemáticamente:

(2.71828) 5 50 (2.71828) 5 51 (2.71828) 5 5 2


P( x  2)     0.12468
0! 1! 2!

Resolviéndolo con el Excel, tenemos:

Ingresamos los datos y listo P(x ≤ 2) = 0.12465


2 DISTRIBUCIÓN DE PROBABILIDAD PARA VARIABLES ALEATORIAS CONTINUAS.

La distribución normal de probabilidad

1. Probabilidad.

La probabilidad p de un suceso está comprendida entre 0 y 1 (0 <= p <= 1), en donde:

p = 0 es la probabilidad del suceso imposible.


p = 1 es la probabilidad del suceso seguro.

2. La distribución normal de probabilidad.

La distribución normal de probabilidad, distribución de Gauss o campana de Gauss es una


distribución estadística continua de probabilidad. Se sabe que las características físicas,
psicológicas y sociales de una población, además de otros fenómenos, (inteligencia, peso,
belleza, longevidad, borreguismo, etc.), siguen más o menos la distribución normal de
probabilidad.

Por ejemplo, si la estatura se representa en el eje X, entonces se ve que la mayoría de la


gente tiene una estatura normal, situada en el centro de la gráfica, mientras que una
minoría de gente es muy alta y otra minoría muy baja, saliéndose de lo normal, según lo
mostrado en la gráfica en los extremos izquierdo y derecho. Otro ejemplo es la inteligencia:
La mayoría de la gente es de inteligencia normal, mientras que una minoría es muy
inteligente y otra es muy poco inteligente. O la longevidad: La mayoría de la gente tiene
una esperanza de vida normal, mientras que unos pocos mueren demasiado pronto o
llegan a centenarios.

En el eje X se representa una variable estadística y en el eje Y la probabilidad para cada


valor de X. Algunas características:

 La media, la mediana y la moda son el valor central en donde la distribución alcanza


su valor máximo, siendo una distribución simétrica respecto de este valor. Para
valores alejados de la media, decrece exponencialmente.
 El área total bajo la curva del gráfico es 1. Esto es, la integral de la gráfica es 1. O
dicho de otra forma, la suma total de todas las probabilidades es 1.
 El gráfico de arriba muestra las principales subáreas del gráfico.
 La probabilidad de que x sea cualquier valor <= x1 (donde x1 es un valor cualquiera
de X), es la integral de la curva hasta x1, o sea, el área bajo la curva hasta x1, o lo
que es lo mismo, la suma de todas las probabilidades hasta x1:

3. Equivalencia entre probabilidades y conjuntos.

Hay una equivalencia en operar con probabilidades y operar con conjuntos, debido a que
ambas cosas siguen el álgebra de Boole.

a) Operar con conjuntos.


El conjunto total es el conjunto formado por todos los elementos, del que se obtienen
subconjuntos. El conjunto vacío es el conjunto sin ningún elemento.

Si tenemos por ejemplo un conjunto formado por las mujeres muy inteligentes y otro
formado por las mujeres muy atractivas, (ambos conjuntos pequeños, tal y como sugieren
las respectivas distribuciones normales de probabilidad), entonces el subconjunto formado
por las mujeres muy inteligentes que son además muy atractivas será la intersección de
ambos conjuntos, y este subconjunto intersección será de un tamaño menor o como mucho
igual que los conjuntos de mujeres atractivas y de mujeres inteligentes por separado, pues
es obvio que si es difícil encontrar a una atractiva, más difícil es encontrar a una que sea
además inteligente.

Por el contrario, si se quiere encontrar a una que sea inteligente o que sea atractiva (no
necesariamente las dos cosas, sino solamente una de ellas), será la unión de los dos
conjuntos, resultando en un conjunto mayor.

Por último, el conjunto complemento de un subconjunto A es el conjunto que no contiene


ningún elemento de A: Conjunto total – A.

b) Operar numéricamente con probabilidades.

La probabilidad del suceso seguro es 1 y es equivalente al conjunto total. La del suceso


imposible es 0 y es equivalente al conjunto vacío.

Esta operación de intersección de conjuntos se expresa numéricamente en términos de


probabilidades como el producto de las probabilidades. Como la probabilidad de un suceso
es un número menor o igual que 1, el producto de dos probabilidades “p”, “q”, va a ser
menor o igual que 1 también, y menor o igual que “p” y que “q”.

En el ejemplo anterior, supongamos que la probabilidad de encontrar a una mujer atractiva


es p=0’20 y la de encontrar a una inteligente es q=0’25. Entonces, la probabilidad de
encontrar a una que sea inteligente y atractiva es p·q = 0’20 x 0’25 = 0’05, mucho más
pequeña que la de encontrar a una que sólo sea atractiva/inteligente:

p·q <= p
p·q <= q

Por el contrario, la probabilidad de encontrar una mujer que sea o inteligente o atractiva
será la suma de probabilidades p+q = 0’45:

p+q >= p
p+q >= q

Por último, la probabilidad del complemento de p (el conjunto que no tiene elementos en p)
es 1-p: restar la probabilidad de p a la probabilidad del suceso seguro que es 1.
Resumiendo las operaciones del álgebra de Boole con sus equivalentes numéricos de
probabilidad y de conjuntos:

 Producto lógico = Intersección de conjuntos = producto de probabilidades.


 Suma lógica = Unión de conjuntos = suma de probabilidades.
 Complemento = Conjunto total – subconjunto = 1 – p

4. Un estereotipo corregido.

Obsérvese también que las siguientes probabilidades en el ejemplo anterior son la misma:

 Mujer atractiva e inteligente (extremos derecho y derecho en las respectivas


distribuciones normales de probabilidad).
 Atractiva pero no inteligente (extremos derecho e izquierdo en la gráfica de
probabilidad).
 No atractiva pero sí inteligente (extremos izquierdo y derecho de la gráfica de
probabilidad).
 Ni atractiva ni inteligente (extremos izquierdo e izquierdo en la gráfica de
probabilidad).

O sea, todas las combinaciones que se pueden hacer con las dos variables estadísticas
(inteligencia y belleza) y sus dos extremos de probabilidad.

Dicho de otra forma, el tópico de que una guapa es tonta es una tontería. Lo que quiere
decir ese tópico es que es más difícil encontrar a una guapa inteligente que una guapa
NORMAL. Pero es igual de probable que sea guapa e inteligente a que sea guapa y tonta o
a que sea fea e inteligente, o tonta y fea. Y lo más probable es que no sea ninguna de esas
cosas, sino normal en todo, del montón. Lo mismo con los hombres, claro.

Con otras cualidades que supuestamente más o menos siguen la distribución de


probabilidad se aplica lo mismo, con sus respectivas combinaciones. Por ejemplo, con las
causas de mortalidad en una población, demostrándose con facilidad que algunas de esas
causas, como la violencia doméstica, son insignificantes en importancia objetiva por mucha
propaganda que reciban, mientras que otras causas de mortalidad son las principales y
ocupan la situación central en la distribución: Infartos, cáncer, etc.

Aproximación de la distribución binomial a la normal

Una distribución binomial variable discreta la podemos aproximar a una normal, variable continua
cuando n es grande.
Distribución binomial
Problemas aproximar distribución binomial a normal
Manejo de la tabla normal. Casos frecuentes

Ejemplos de uso de la tabla normal. Cuando la variable z es mayor o igual que un número positivo,
menor o igual que un número negativo, entre dos valores positivos, cálculo de la probabilidad en
cada caso. Estudio de los casos más frecuentes.

1 Cuando la probabilidad pedida se encuentra directamente en las tablas

Hallar la probabilidad p ( z ≤ 0,45 )

En la 1ª columna buscamos el valor de las unidades y las décimas.

En la 1ª fila el valor de las centésimas.

Basta buscar 0,4 en la columna y 0,05 en la fila. Su intersección nos da la probabilidad.


Leemos y nos da 0,6736. La probabilidad p ( z ≤ 0,45 ) = 0,6736

2 Probabilidad de un valor positivo p ( z > 1,24)

En este caso la probabilidad pedida no está en las tablas.

Sin embargo, si tenemos en cuenta que el área total bajo la gráfica ha de ser 1, deducimos de la figura
que:

p (z > 1,24) = 1 – p (z ≤ 1,24) = 1 – 0,8925 = 0,1075

3 Probabilidad de un valor negativo p ( z ≤ - 0,72 )


Como la gráfica es simétrica respecto al eje de ordenadas, p ( z ≤ - 0,72 ) = p ( z ≥ + 0,72 )

Calculamos p ( z ≥ + 0,72 ) igual que en el caso 2.

p ( z ≥ + 0,72 ) = 1 - p ( z < + 0,72 ) = 1 - 0,7642 = 0,2358

p ( z ≤ - 0,72 ) = p ( z ≥ + 0,72 )= 1 - p ( z < + 0,72 ) = 1 - 0,7642 = 0,2358

4 Probabilidad entre dos valores positivos p ( 0,5 ≤ z ≤ 1,76 )

Leemos directamente en la tabla la p ( z ≤ 1,76 ) y la p ( z ≤ 0,5 ).

La diferencia entre ellas es la probabilidad que nos piden.

p ( 0,5 ≤ z ≤ 1,76 ) = p ( z ≤ 1,76 ) - p ( z ≤ 0,5 ) = 0,9608 - 0,6915 = 0,2693


5 Probabilidad entre dos valores negativos p ( - 1,76 ≤ z ≤ - 0,5 )

Por simetría cambiamos los dos valores negativos a positivos y calculamos sus probabilidades.

p ( - 1,76 ≤ z ≤ - 0,5 ) = p ( 0,5 ≤ z ≤ 1,76 ) = 0,9608 - 0,6915 = 0,2693

Observa que el área sombreada es la misma que en el caso 4.

6 Probabilidad entre un valor positivo y uno negativo p(- 0,53 ≤ z ≤ 2,46)

p(- 0,53 ≤ z ≤ 2,46) = p ( z ≤ 2,46) - p ( z ≤ - 0,53 )


p ( z ≤ - 0,53 ) = p ( z ≥ 0,53 ) = 1 - p ( z < 0, 53)= 1 - 0,7019 = 0,2981

p(- 0,53 ≤ z ≤ 2,46) = p ( z ≤ 2,46) - p ( z ≤ - 0,53 ) = 0,9931 - 0,2981 = 0,695

Manejo de la tabla de forma inversa

Ejercicios
Una estimación es puntual cuando se usa un solo valor extraído de la muestra para estimar el
parámetro desconocido de la población. Al valor usado se le llama estimador.

 La media de la población se puede estimar puntualmente mediante la media de la muestra:

 La proporción de la población se puede estimar puntualmente mediante la proporción de la


muestra:

 La desviación típica de la población se puede estimar puntualmente mediante la desviación


típica de la muestra, aunque hay mejores estimadores:

A veces es conveniente obtener unos límites entre los cuales se encuentre el parámetro con un
cierto nivel de confianza, en este caso hablamos de estimación por intervalos.

Prueba de hipótesis

Hipótesis estadísticas

Un test estadístico es un procedimiento para, a partir de una muestra aleatoria y significativa,


extraer conclusiones que permitan aceptar o rechazar una hipótesis previamente emitida sobre el
valor de un parámetro desconocido de una población.

La hipótesis emitida se designa por H0 y se llama hipótesis nula.


La hipótesis contraria se designa por H1 y se llama hipótesis alternativa.

Contrastes de hipótesis

1. Enunciar la hipótesis nula H0 y la alternativa H1.

Bilateral H0=k H1 ≠ k

H0≥ k H1 < k
Unilateral
H0 ≤k H1> k

2. A partir de un nivel de confianza 1 − α o el de significación α. Determinar:

El valor zα/2 (bilaterales), o bien zα (unilaterales)

La zona de aceptación del parámetro μ o p.

3. Calcular: x o p', a partir de la muestra.

4. Si el valor del parámetro muestral está dentro de la zona de la aceptación, se acepta la


hipótesis con un nivel de significación α. Si no, se rechaza.

Contraste bilateral

Se presenta cuando la hipótesis nula es del tipo H0: μ = k (o bien H0: p = k) y la hipótesis alternativa,
por tanto, es del tipo H1: μ≠ k (o bien H1: p≠ k).

El nivel de significación α se concentra en dos partes (o colas) simétricas respecto de la media.


La región de aceptación en este caso no es más que el correspondiente intervalo de probabilidad
para x o p', es decir:

o bien:

Se sabe que la desviación típica de las notas de cierto examen de Matemáticas es 2,4. Para una
muestra de 36 estudiantes se obtuvo una nota media de 5,6. ¿Sirven estos datos para confirmar la
hipótesis de que la nota media del examen fue de 6, con un nivel de confianza del 95%?

1. Enunciamos las hipótesis nula y alternativa:

H0 : μ = 6 La nota media no ha variado.

H1 : μ ≠ 6 La nota media ha variado.

2. Zona de aceptación

Para α = 0.05, le corresponde un valor crítico: zα/2 = 1.96.

Determinamos el intervalo de confianza para la media:

(6 − 1,96 · 0,4 ; 6 + 1,96 · 0,4) = (5,22 ; 6,78)

3. Verificación.

Valor obtenido de la media de la muestra: 5,6 .

4. Decisión

Aceptamos la hipótesis nula H0, con un nivel de significación del 5%.

Contraste unilateral

Caso 1
La hipótesis nula es del tipo H0: μ ≥ k (o bien H0: p ≥ k).

La hipótesis alternativa, por tanto, es del tipo H1: μ < k (o bien H1: p < k).

Valores críticos

1−α α zα

0.90 0.10 1.28

0.95 0.05 1.645

0.99 0.01 2.33

El nivel de significación α se concentra en una parte o cola.

La región de aceptación en este caso será:

o bien:

Un sociólogo ha pronosticado, que en una determinada ciudad, el nivel de abstención en las próximas
elecciones será del 40% como mínimo. Se elige al azar una muestra aleatoria de 200 individuos, con
derecho a voto, 75 de los cuales estarían dispuestos a votar. Determinar con un nivel de significación
del 1%, si se puede admitir el pronóstico.

1. Enunciamos las hipótesis nula y alternativa:

H0 : μ ≥ 0.40 La abstención será como mínimo del 40%.

H1 : μ < 0.40 La abstención será como máximo del 40%;

2. Zona de aceptación

Para α = 0.01, le corresponde un valor crítico: zα = 2.33.

Determinamos el intervalo de confianza para la media:

3.Verificación.

4.Decisión

Aceptamos la hipótesis nula H0. Podemos afirmar, con un nivel de significación del 1%, que la La
abstención será como mínimo del 40%.

Caso 2

La hipótesis nula es del tipo H0: μ ≤ k (o bien H0: p ≤ k).

La hipótesis alternativa, por tanto, es del tipo H1: μ > k (o bien H1: p > k).
El nivel de significación α se concentra en la otra parte o cola.

La región de aceptación en este caso será:

o bien:

Un informe indica que el precio medio del billete de avión entre Canarias y Madrid es, como
máximo, de 120 € con una desviación típica de 40 €. Se toma una muestra de 100 viajeros y se
obtiene que la media de los precios de sus billetes es de 128 €.

¿Se puede aceptar, con un nivel de significación igual a 0,1, la afirmación de partida?

1. Enunciamos las hipótesis nula y alternativa:

H0 : μ ≤ 120

H1 : μ > 120

2.Zona de aceptación

Para α = 0.1, le corresponde un valor crítico: zα = 1.28 .

Determinamos el intervalo de confianza:

3. Verificación.

Valor obtenido de la media de la muestra: 128 € .

4. Decisión

No aceptamos la hipótesis nula H0. Con un nivel de significación del 10%.


Errores de tipo I y tipo II

Error de tipo I. Se comete cuando la hipótesis nula es verdadera y, como consecuencia del
contraste, se rechaza.

Error de tipo II. Se comete cuando la hipótesis nula es falsa y, como consecuencia del contraste se
acepta.

H0 Verdadera Falsa

Decisión correcta Decisión incorrecta:


Aceptar
Probabilidad = 1 − α ERROR DE TIPO II

ERROR DE TIPO I
Rechazar Decisión correcta
Probabilidad = α

La probabilidad de cometer Error de tipo I es el nivel de significación α.

La probabilidad de cometer Error de tipo II depende del verdadero valor del parámetro. Se hace
tanto menor cuanto mayor sea n.

ANALISIS DE CORRELACION
(Simple)

ANÁLISIS DE CORRELACION: Es el grupo de técnicas estadísticas empleado para medir la intensidad


de la relación (correlación) entre dos variables.

El principal objetivo del análisis de correlación es determinar qué tan intensa es la relación entre dos
variables. Una medida de esta relación es el coeficiente de correlación ( r ) el cual puede tomar valores en una
escala desde –1 hasta +1 inclusive como se indica enseguida.

INTENS MODERA DEBIL DÉBIL MODERADA INTENSA


-1.00 -0.50 0 +0.50 +1.00

correlación negativa (C.N.) correlación positiva (C.P.)

COEFICIENTE DE CORRELACION ( r ): Originado por el investigador Karl Pearson aproximadamente


en el año 1900, el coeficiente de correlación describe la intensidad de la relación entre dos conjuntos de
variables, por lo cual también se le conoce como r de Pearson.

Si r toma los valores de –1 o de +1 indica correlación perfecta como se indica en los siguientes
diagramas de dispersión.

(Gráfica que indica la relación entre las dos variables).

y y

r = -1 r = +1

x x

Correlación Negativa Prefecta Correlación Positiva Perfecta

Si r = 0 indica que no existe ninguna correlación entre las dos variables.

El coeficiente de correlación se calcula mediante la siguiente fórmula:

n( xy)  ( x)( y)


r
[n( x²)  ( x)²][n( y ²)  ( y)²]

Donde:
n  es el número de pares de observaciones (x, y)

x  valores de la variable independiente x.

y  valores de la variable dependiente y.

EJEMPLO:

El director de personal de una empresa debe entrevistar y seleccionar nuevo personal para el área de
ventas. Ha diseñado una prueba que ayude a seleccionar los mejores aspirantes. Con la finalidad de
verificar la validez de su prueba, como instrumento de predicción de las ventas semanales, eligió al
azar cinco vendedores experimentados y aplicó la prueba a cada uno (esta muestra es pequeña para
fines didácticos, en la práctica debe tomarse una muestra mucho mayor).

Los resultados obtenidos se muestran en la tabla siguiente:

VENDEDOR PUNTUACIÓN DE PRUEBA VENTAS SEMANALES

SR. MARTÍN 4 3 4 $ 5,000

SR. JOSE 7 5 10 12,000

SRA. MARIA 3 4 5 4,000

SR. JUAN 6 6 6 8,000

SRA. SILVIA 10 8 9 11,000

Se piensan entonces que las ventas semanales dependen de la puntuación de prueba por lo cual se
toman las ventas como variable dependiente ( y ) y la puntuación de prueba como variable independiente ( x ).

Examen
El diagrama de dispersión de los datos anteriores se muestra a continuación:

Ventas 14

Semanales 12

10

1 2 3 4 5 6 7 8 9 10 11 x

puntuación de prueba

Utilizando los datos originales se construye lo siguiente:

Puntuación de Ventas
Prueba ( X ) Semanales ( Y )
X² XY Y²

4 5 16 20 25

7 12 49 84 144

3 4 9 12 16

6 8 36 48 64

10 11 100 110 121

X = 30 Y = 40 X² = 210 XY = 274 Y² = 370

El coeficiente de correlación es 0.88 calculado por:

n( xy)  ( x)( y)


.r 
[n( x²)  ( x)²][n( y ²)  ( y)²]

5( 274 ) – ( 30 )( 40 ) 170 .

= √ [ 5 ( 210 ) – ( 30 )² ] [ 5 ( 370 ) – ( 40 )² ] =√ (150)(250) = 0.88


Lo cual indica una relación muy intensa.

Coeficiente de determinación: Es la proporción de la variación total en la variable dependiente (y)


que se explica por, o se debe a, la variación total en la variable dependiente (x).

COEFICIENTE DE DETERMINACIÓN = (COEFICIENTE DE CORRELACIÓN)² = r²

Para el ejemplo anterior el coeficiente de correlación es = ( 0.88 )² = 0.77 e indica que el 77% de la
variación total en las ventas semanales se explica por, o se debe a, la variación en las puntuaciones de prueba.

Coeficiente de no-determinación: Es el complemento del coeficiente de determinación. Para el


ejemplo el coeficiente de no-determinación = 1 - r² = 1 - 0.77 = 0.23. Esto significa que 23% de la variación
total en las ventas semanales no se debe a la variación en las puntuaciones de prueba.

Un coeficiente de correlación de 0.80 da un coeficiente de determinación de 0.64. Algunos estadígrafos


preferirían utilizar la medida más conservadora (0.64), considerando que el coeficiente de correlación de 0.80
puede exagerar la relación entre los dos conjuntos de variables.

Ejercicios
Propuestos

Texto Páginas Ejercicios

Manson y Lind 500...502 1....4

ANALISIS DE REGRESION LINEAL


(SIMPLE)

Se define a la regresión lineal como una relación fundamental entre dos o más variables
correlacionadas y se usa para pronosticar una variable con base en la otra. Por lo general la relación se obtiene
de dos datos observados. En la regresión lineal la relación entre variables forma una línea directa.

La línea de regresión lineal es de la forma y’ = a + bx, donde y’ es la variable dependiente que queremos
resolver; a es la intersección de y’; b es la dependiente y x es la variable independiente (en el análisis de series
de tiempo, x representa unidades de tiempo).
La regresión lineal es útil para pronósticos a largo plazo de sucesos importantes y para la planificación
agregada. Por ejemplo, sería muy útil para pronosticar la demanda de familias de productos. Aunque es
probable que durante un periodo varié bastante la demanda para un producto específico de la familia, la
demanda para toda la familia es sorpresivamente regular.

La restricción principal para usar los pronósticos de regresión lineal es que, supuestamente, los datos
pasados y las proyecciones caen sobre una línea recta. Aunque esto limita su aplicación, algunas veces, si
usamos un periodo más breve puede usarse el análisis de regresión lineal. Por ejemplo, si existe una tendencia
de crecimiento y usamos un período de diez o veinte años la tendencia se pierde entre todos los datos y será
baja la proyección para el año siguiente. Sin embargo, si sólo usamos los últimos años, el pronóstico será más
preciso. Es una parte del procedimiento de regresión lineal se estima lo adecuado del ajuste en la línea con
los datos.

La regresión lineal se usa tanto para pronósticos de series de tiempo como para pronósticos de
relaciones causales cuando la variable dependiente (por lo general el eje vertical de un gráfico) cambia como
resultado del tiempo (el eje horizontal en el gráfico), se trata de un análisis de series de tiempo. Si una variable
cambia debido al cambio de otra variable, estamos ante una relación causal (como el incremento en el número
de muertes por cáncer en el pulmón con respecto a las personas que fuman).

METODO DE MINIMOS CUADRADOS

El método de mínimos cuadrados trata de ajustar a la línea a los datos que minimicen la suma de los
cuadrados de la distancia vertical entre cada punto de datos y su punto correspondiente a la línea.

La ecuación de mínimos cuadrados para la regresión lineal es la que se indica a continuación:

y’ = a + bx

Donde:

y’  variable dependiente calculada por la ecuación, indica el pronóstico para el período x.

x periodo de tiempo.

a  es el valor de y’ cuando x es = 0.
b  es la pendiente de la línea.

 y  b x n xy   x y
a b
n n x²   x ²

y  Representa el valor de la variable correspondiente del periodo x.

EJEMPLO 1.

Pronostique las ventas para los periodos 13, 14 y 15 si las ventas de los 12 periodos anteriores son los
que se indican a continuación.

Periodo (x) Ventas (y) (xy) (x²) Y’


1 600 600 1 801.3

2 1550 3100 4 1160.9

3 1500 4500 9 1520.5

4 1500 6000 16 18880.1

5 2400 12000 25 2239.7

6 3100 18600 36 2599.4

7 2600 18200 49 2959.0

8 2900 23200 64 3318.6

9 3800 34200 81 3678.2

10 4500 45000 100 4037.8

11 4000 44000 121 4397.4

12 4900 58800 144 4757.1

x = 78 y = 33,350  = 268,200 = 650


Calculando la pendiente:

12(268,200)  78(33,350) 3218,400  2601300 617,100


b    359.6153
12(650)  (78)² 7800  6084 1716

Por lo tanto el valor de a será:

33,350  359.6153(78)
a  441.66
12

El pronóstico para el periodo 13 será:

y’13 = a +bx = 441.66 + 359.6153 (13) = 5,116

y para el periodo 14 y 15:

y’14 = 441.66 + 359.6153 (14) = 5,476

y’15 = 441.66 + 359.6153 (15) = 5,836

V $5000

E 4000

Pronósticos de Venta

N 3000

T 2000
A 1000

S 500

Línea de Regresión

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

PERIODO ( X )

El error estándar de estimación, o sea, la calidad de ajuste de la línea a los datos anteriores es:

y i  y 'i ²
Sy '  i 1
 363.9
n2

Una ecuación más fácil de calcular para el error estándar es:

Sy ' 
 y ²  a y  b xy
n2
EJEMPLO 2.

Volviendo a las puntuaciones de prueba y las ventas semanales de los cinco vendedores, las sumas y
otros datos básicos para despejar o evaluar a y b aparecen en la tabla siguiente:

Ventas
semanales
Puntuación (niveles de
de prueba. dólares)

Vendedor X Y X² XY Y²

Sr. Amber 4 5 16 20 25

Sr. Archer 7 12 49 84 144

Sra. Smith 3 4 9 12 16

Sr. Malcolm 6 8 36 48 64

Sra. Goodwin 10 11 100 110 121

Total 30 40 210 274 370

¿Cuál es la ecuación de regresión?

SOLUCION:

Las sumas de la tabla anterior se utilizan para ilustrar los cálculos para a y b en la ecuación de regresión:
n xy   x y 5274  (30)( 40)
b
n x²   x ²
= = 1.133
5(210)  (30)²

a = Y – bx = (40/5) – 1.133(30/5) = 8 – 6.798 = 1.202

Y’ = 1.202 + 1.133 (EN MILES DE DÓLARES).

Por tanto, la ecuación de regresión es y’ = 1.202 + 1.133x (en miles de dólares). Las ventas
pronosticas para un candidato a un puesto en ventas, que calificó 6 en la puerta del director de
personal es $8000, que se obtiene por y’ = a + bx = 1.202 + 1.133(6) = 1.202 + 6.798 = 8.000 (en
miles de dólares).

EJERCICIO:

Datos: Calcular el pronóstico para los meses de enero, febrero y marzo del año siguiente.

E F M A M J J A S O N D E F M A M J J A S O N D E F M

68 55 63 82 87 63 77 78 62 78 74 62 74 80 96 74 71 71 66 86 85 89 91 103

You might also like