Professional Documents
Culture Documents
Mquina
0.65
Botella
D
Resultados
AD
0.98
Dc
ADc
0.01
BD
0.99
Dc
BDc
fabricar botella
0.35
0.02
La probabilidad de que una botella cualquiera haya sido producida por la mquina A es 0.65, pues de las
10,000 producidas, 6,500 son producidas por A. Interesa calcular P( A | D ), la cual no se puede obtener de
forma directa de los datos o del rbol que los representa. Para esto se recurre directamente a la definicin de
probabilidad condicional: P( A | D) = P( A D ) / P( D ).
Teorema de Bayes
p. 2
Las cantidades P( A D ) y P( A ) se pueden obtener del rbol. Para que una botella seleccionada al azar
sea una botella defectuosa producida por la mquina A, se selecciona primero la mquina A y de las botellas
producidas all se selecciona una defectuosa. La expresin P( A D ) = P( A ) P( D | A ) equivale a hacer una
travesa en el rbol desde su raz o comienzo, hasta la hoja final donde se obtiene el resultado A D. As
P( A D ) = 0.65 0.02.
Para encontrar P( D ) es necesario darse cuenta de que
una botella defectuosa puede ser producida por la mquina A o
BDc
por la B. Al examinar las hojas del rbol, se encuentran dos
lugares donde se obtiene una botella defectuosa: A D o B D.
ADc
Defectuosas
Esto equivale a hacer una travesa por uno de dos caminos en el
AD BD
rbol. Estos caminos son mutuamente excluyentes, pues si se
camina por uno no puede caminarse por el otro. Segn se
muestra en la Figura 1, el evento D = ( A D ) ( B D ) y su
Mquina B
Mquina A
probabilidad es entonces calculada
P( D ) = P( A D) + P( B D ).
Figura 1 Particin de la produccin de botellas.
El primero de estos trminos P( A D ) ya fue
calculado. El segundo, P( B D ), se obtiene de forma similar, P( B D ) = P( B )P( D | B ). Juntando estos
resultados, P( D ) = P( A ) P( D | A ) + P( B ) P( D | B ). Finalmente se calcula la probabilidad deseada:
6,500
.02
P(A) P( D | A)
.013
10,000
P( A | D )
.788
P( D | A)P(A) P(D | B)P(B) 6,500
3,500
.013 .0035
.02
.01
10,000
10,000
Por lo tanto, una vez se sabe que una botella seleccionada al azar est defectuosa, la probabilidad de
que haya sido producida por la mquina A es .788. Dicho de otra manera, de todas las botellas defectuosas
produdidas, aproximadamente el 79% son producidas por la mquina A.
Pregunta 1
Cmo se puede explicar que la mquina A produzca el 79% de las botellas defectuosas?
Este hecho se debe a dos factores. El primero es que la mquina A produce casi el doble de botellas que
la mquina B. An si la tasa de botellas defectuosas fuera la misma para ambas mquinas, por el mero hecho de
producir un mayor nmero de botellas, la mquina A producira casi el doble de defectuosas de la mquina B. El
segundo factor es que la tasa de produccin de defectuosas de la mquina A es el doble de la correspondiente
de la mquina B. En este caso, an si ambas mquinas produjeran la misma cantidad de botelllas, las producidas
por la mquina A contendran el doble de botellas defectuosas que las que vienen de la mquina B.
Ejemplo 2
El gobierno aprob una ley para hacer obligatorio que los cerca de 200,000 empleados pblicos se
sometan a una prueba para detectar si son usuarios de drogas. Se estima que el 1% de los empleados pblicos
del pas son usuarios de drogas. La prueba que se ofrece muestra un resultado positivo en el 98% de los casos en
que se le administra a una persona que usa drogas, es decir, detecta el 98% de los usuarios de drogas. De
manera similar, si la persona no usa droga alguna, la prueba arroja un resultado negativo en el 99% de los casos.
2012 Pedro J. Rodrguez Esquerdo
Teorema de Bayes
p. 3
Comienzo
Usa Drogas?
Resultados
0.98
Resultado de la
prueba
Pos
0.02
Neg
UNeg
0.01
Pos
UcPos
0.99
Neg
UcNeg
UPos
U
0.01
0.99
c
Pos
Uc
U
Figura 2 Particin de las personas
Estas dos ltimas probabilidades no se pueden sumar, ya que son valores obtenidos bajo condiciones distintas, la base de
comparacin no es la misma. En el primer caso se compara la cantidad de resultados positivos del total de usuarios de
drogas mientras que el segundo compara la cantidad de resultados negativos al total de personas que no usan drogas.
Teorema de Bayes
p. 4
Para encontrar P( Pos ), se considera que la prueba puede arrojar un resultado positivo cuando la
persona es un usuario de drogas o en el caso en que no lo sea. Por esta razn hay dos caminos mutuamente
excluyentes en el rbol donde se obtiene un resultado positivo. Segn se muestra tambin en la Figura 2, el
evento Pos = ( U Pos ) ( Uc Pos ) y su probabilidad es P( Pos )= P( U Pos ) + P( Uc Pos ). El trmino
P( U Pos ) ya haba sido calculado, el segundo se obtiene de forma similar. Obtenemos entonces que
P( Uc Pos ) = P( Uc ) P( Pos | Uc ). Uniendo estos resultados tenemos que
P( Pos ) = P( U ) P( Pos | U) + P( Uc ) P( Pos | Uc). La probabilidad deseada es
P(U | Pos )
P(U) P( Pos | U)
.01 .98
.0098
.497
c
c
P(U) P( Pos | U) P(U ) P(Pos | U ) .01 .98 .99 .01 .0098 .0099
R1
R2
B1
Teorema de Bayes
p. 5
seleccionada es roja por R1 y el evento de que la segunda sea roja por R2. Entonces la probabilidad buscada es
P( R1 | R2 ).
1/4
2/5
3/4
3/5
2/4
2/4
Figura 4. Diagrama de rbol que ilustra el experimento de seleccionar dos canicas de una caja
La definicin de probabilidad condicional permite escribir P( R1 | R2 ) = P( R1 R2 ) / P( R2 ). Para
encontrar el numerador se usa nuevamente la definicin de probabilidad condicional,
P( R1 R2 ) = P( R2 | R1 )P( R1 ). Ahora se calcula el denominador, P( R2 ) descomponiendo el evento R2 en dos
eventos disyuntos, tal como en la Figura 4: R2 = (B1 R2) (R1 R2). De esta manera se obtiene la probabilidad
P( R2 ) = P( B1 R2 ) + P ( R1 R2 ).
Usando nuevamente la definicin de probabilidad condicional P( B1 R2) = P( R2 | B1 )P( B1 ). Por lo
tanto, el denominador es P(R2) = P(R2 | R1)P(R1) + P(R2 | B1)P(B1). El resultado deseado es igual que antes:
1 2
P( R2 | R1 ) P( R1 )
1
4
5
P( R1 | R2 )
.
P( R2 | R1 ) P( R1 ) P( R2 | B1 ) P( B1 ) 1 2 2 3 4
4 5 4 5
Ejemplo 4
En el 1991 los contribuyentes de Puerto Rico sometieron un total de 1,320,600 planillas de contribucin
sobre ingresos al Departamento de Hacienda. Los datos se desglosan en la siguiente tabla por nivel de ingreso y
si la planilla se somete conjunta o por separado.
Nivel de ingreso
Total
1,023.2
173.6
88.5
35.3
1,320.6
Teorema de Bayes
p. 6
Pregunta 4
El Secretario de Hacienda selecciona una planilla al azar.Cul es la probabilidad de que la planilla haya sido
sometida en forma conjunta si el nivel de ingreso en ella era menor de $20,000? Cul es la probabilidad de que
el nivel de ingreso en ella era menor de $20,000 si la la planilla fue sometida en forma conjunta?
Para contestar la primera pregunta, se examina la primera fila de la Tabla 1, donde todas las planillas
sometidas, 1,023,000, reflejan un ingreso menor de $20,000. De esas, 457,500 fueron sometidas en forma
conjunta, as la probabilidad deseada es: 475.5 / 1,023.0 = 0.46.
Para contestar la segunda pregunta se examina en vez la columna correspondiente a las planillas que se
sometieron en forma conjunta. El total que se indica al final de esa columna ser la base de comparacin. Se
sometieron 621,600 planillas conjuntas de las cuales 457,500 corresponden a planillas que adems indicaron un
ingreso menor de $20,000. Por lo tanto la probabilidad buscada es 475.5 / 621.6 = 0.76.
Si se usara como base de comparacin los resultados obtenidos para describir la poblacin de planillas
recibidas, de las planillas que reflejaron un ingreso menor de $20,000, el 46% correspondan a planillas
sometidas en forma conjunta. En el otro caso, de todas las planillas sometidas en forma conjunta, el 76%
corresponde a planillas que reflejan un ingreso menor de $20,000. Estos dos porcentajes no son iguales ni
significan lo mismo pues reflejan bases de comparacin distintas.
En una tabla es muy fcil calcular probabilidades condicionales. En este caso, aunque en la prctica no se
usara el mtodo de anlisis que ofrece la regla de Bayes, es ejemplo que sigue ilustra su uso, con el fin de
presentar una forma organizada de resolver estos problemas.
Denote por C el evento de que la planilla se somete en forma conjunta, por S el evento de que la planilla
se somete por separado y por I el ingreso reflejado en la planilla. De la definicin de probabilidad condicional,
P( C { I $20,000})
P( C { I $20,000})
P( { I $20,000})
P{ C { I $20,000}} { S { I $20,000}}
P C { I $20,000}
.
P C { I $20,000}) P( S { I $20,000}
P( C | I $20,000)
P( C | I $20,000)
P( I $20,000 | C ) P(C )
.
P( I $20,000 | C)P(C) P( I $20,000 | S) P( S )
Pregunta 5
Representa estos datos usando un diagrama de Venn.
Teorema de Bayes
p. 7
A2
A3
A4
A5
A , entonces
i
i 1
P( B) P( Ai ) P( B | Ai ) .
i 1
Prueba.
Ya que A1, A2, , An es una particin de S, sique que el evento B
se puede rescribir B = B S = B (
A6
A ) = ( B A ) . Ahora
i
i 1
i 1
A1
( B A )) P( B A ) P( A ) P( B | A ) .
P(B) = P(
i 1
i 1
i 1
P( Ai | B)
P( Ai ) P( B | Ai )
n
P( A ) P( B | A )
j 1
Teorema de Bayes
p. 8
Prueba.
P( B Ai )
. Para calcular el numerador se usa
P( B)
nuevamente la definicin, esta vez condicionando por Ai, P( B Ai ) P( B | Ai ) P( Ai ). El denominador se
De la definicin de probabilidad condicional P( Ai | B)
P( Ai | B)
P( B Ai ) P( Ai ) P( B | Ai )
P( B)
P( B)
P( Ai ) P( B | Ai )
n
P( A ) P( B | A )
j 1
Pregunta 6
Expresa los problemas presentados en los ejemplos 1,2, 3 y 4 en trminos de la regla de Bayes. Indica a qu
corresponden la particin y el evento B.
3. Problemas y ejercicios
1. Una fbrica tiene tres mquinas para producir bombillas. La mquina A produce el 35% del total de bombillas,
la mquina B produce el 50% y la mquina C produce el 15% de las bombillas. Sin embargo, las mquinas no son
perfectas, la mquina A daa el 10% de las bombillas que produce. La mquina B daa el 5% y la mquina C daa
el 20%.
a. Representa estos datos en un diagrama de rbol.
b. La fbrica produce 10,000 bombillas sin defectos en un da. Cuntas de stas corresponden a la
mquina A? Cuntas daa en un da?
c. Si seleccionamos una bombilla de la mquina C, cul es la probabilidad de que est defectuosa?
d. Luego de fabricadas, pero antes de probarlas, las bombillas se colocan juntas en un saln. Si se
selecciona una bombilla al azar, cul es la probabilidad de que est defectuosa?
e. Si se comprueba que una bombilla est defectuosa, cul es la probabilidad de que provenga de la
mquina B?
2. Una muestra de 400 adultos varones con angina de pecho son clasificados por peso y estatura como sigue:
Peso (libras)
Edad (aos)
130-149
150-169
170-189
190 o ms
30-39
10
20
20
40
40-49
10
15
50
70
50-59
5
15
50
40
60-69
5
10
15
25
Un individuo se selecciona al azar de entre los 400 participantes. Encuentra la probabilidad de que:
a. tiene entre 40-49 aos de edad
b. est en el intervalo de 40-49 aos y pesa 170-189 libras
c. est en el intervalo 40-49 aos entre 60-69 aos
d. est en el intervalo 30-39 o 50-59 aos y pesa 150-169 libras
e. pesa menos de 170 libras
f. pesa menos de 190 libras y es mayor de 49 aos
g. pesa menos de 170 libras dado que es menor de 50 aos
h. Son los eventos {tiene 60-69 aos} , {pesa 130-149 libras} independientes? Explica.
i. Son los eventos {tiene 50-59 aos} , {pesa 130-149 libras} mutuamente excluyentes? Explica.
2012 Pedro J. Rodrguez Esquerdo
Teorema de Bayes
p. 9
3. Un estudio neurolgico sobre la relacin entre la presin sangunea alta y la incidencia de derrame cerebral
encontr que:
a. para personas mayores de 70 aos, el 10% tendr un derrame dentro de los prximos cinco aos
b. de todos los pacientes de 70 aos o ms que han tenido un derrame, el 40% tena presin alta
c. para personas de 70 aos o mas que no ha sufrido de derrame, el 20% tiene presin alta.
d. Un paciente de 74 aos visita a su mdico y ste le encuentra con la presin alta. Cul es la
probabilidad de que sufra un derrame cerebral en los prximos cinco aos?