You are on page 1of 10

Regla de Bayes

El Teorema o Regla de Bayes nos brinda un mtodo para contestar algunas preguntas muy importantes. En su esencia, esta regla nos indica cul informacin es necesaria tener y el mtodo para invertir la condicin cuando calculamos una probabilidad condicional: si A y B son eventos y conocemos P(A | B), P(B), P(A | Bc), entonces podemos calcular P(B | A). La necesidad de calcular este ltimo valor a partir de la informacin disponible es imprescindible para entender las consecuencias de algunas de nuestras decisiones. En esta seccin estudiaremos varios ejemplos que luego generalizaremos para obtener formalmente la regla de Bayes. Esto ejemplos a su vez ilustrarn cun importante y somunes son las situaciones donde es necesario usar esta regla. En muchas ocasiones nos hacemos preguntas sobre temas que no estn, a primera vista muy relacionados entre s. Sin embargo, luego de un anlisis ponderado, comenzamos a notar que las respuestas o los mtodos para obtenerlas guardan algunas relaciones entre s. Ejemplo 1 Considera una fbrica de botellas que cuenta con dos mquinas para producir sus botellas. En esa fbrica se producen 10,000 botellas al da. La mquina A produce 6,500 botellas diarias de las cuales el 2% son defectuosas. La mquina B produce 3,500 botellas cada da de las cuales el 1% son defectuosas. Pregunta El inspector de calidad de la compaa selecciona una botella al azar y encuentra que est defectuosa. Cul es la probabilidad de que la botella haya sido producida por la mquina A? Para visualizar mejor los datos, los organizamos en un diagrama de rbol. Denotamos por A el evento de que la botella seleccionada haya sido producida por la mquina A y por B el evento de que haya sido producida por la mquina B. El evento de que la botella seleccionada sea defectuosa se denota por D, su complemento Dc representa una botella que no es defecuosa. Comienzo Mquina .02 A .65 .35 B .99 Dc BDc .98 .01 Dc D ADc BD Botella D Resultados AD

La probabilidad de que una botella cualquiera haya sido producida por la mquina A es .65, pues de las 10,000 producidas, 6,500 son producidas por A. Nos interesa calcular P(A | D), la cual no se puede obtener de forma directa de los datos o del rbol que los representa. Para esto recurrimos directamente a la definicin de probabilidad condicional: P( A | D) = P(AD) / P(D). Las cantidades P(AD) y P(A) se pueden obtener del rbol. Para que una botella seleccionada al azar sea una defectuosa producida por la mquina A, debemos seleccionar primero la mquina A y de las botellas producidas all seleccionar una defectuosa. Tenemos que P(AD) = P(A) P( D | A), lo que equivale a hacer la travesa en el rbol desde su raz o comienzo hasta la hoja donde obtenemos el resultado AD. As P(AD) = .65 .02.
C:\My Documents\Cursos\M 5001\1.04.Teorema de Bayes.doc pag. 1

Para encontrar P(D) debemos darnos cuenta que una botella defectuosa puede ser producida de la mquina A o de la B. Si examinamos las hojas del rbol, vemos que hay dos lugares donde obtenemos una botella defectuosa, AD o BD. Esto equivale a hacer una travesa por uno de caminos en el rbol. Estos caminos son mutuamente excluyentes, pues si caminamos por uno no podemos estar caminando por el otro. Segn se muestra en la figura de al lado, el evento D = (AD) (BD) y su probabilidad es entonces calculada P(D) = P(AD) + P(BD).

BDc ADc Defectuosas AD BD

Mquina A

Mquina B

El primero de estos trminos P(AD) ya haba sido calculado. El segundo se obtiene de forma similar. Obtenemos entonces que P( BD) = P(B) P(D | B). Uniendo estos resultados tenemos que P(D) = P(A) P( D | A) + P(B) P(D | B). Finalmente podemos calcular la probabilidad deseada:

Figura 1 Particin de las botellas defectuosas de acuerdo a la mquina

6,500 .02 P(A) P( D | A) .013 10,000 P( A | D ) = = = = .788 P( D | A)P(A) + P(D | B)P(B) 6,500 3,500 .013 + .0035 .02 + .01 10,000 10,000 Esto quiere decir que una vez sabemos que una botella seleccionada al azar est defectuosa, la probabilidad de que haya sido producida por la mquina A es .788. Dicho de otra manera, de todas las botellas defectuosas produdidas, aproximadamente el 79% son producidas por la mquina A. Pregunta Cmo se puede explicar que la mquina A produzca el 79% de las botellas defectuosas? Este hecho se debe a dos factores. El primero es que la mquina A produce casi el doble de botellas que la mquina B. An si la tasa de botellas defectuosas fuera la misma para ambas mquinas, por el mero hecho de producir un mayor nmero de botellas, la mquina A producira casi el doble de defectuosas de la mquina B. El segundo factor es que la tasa de produccin de defectuosas de la mquina A es el doble de la correspondiente de la mquina B. En este caso, an si ambas mquinas produjeran la misma cantidad de botelllas, las producidas por la mquina A contendran el doble de botellas defectuosas que las que vienen de la mquina B. Ejemplo 2 El gobierno de Puerto Rico aprob una ley para hacer obligatorio que los cerca de 200,000 empleados pblicos se sometan a una prueba para detectar si son usuarios de drogas. Se estima que el 1% de los empleados pblicos del pas son usuarios de drogas. La prueba que se ofrece muestra un resultado positivo en el 98% de los casos en que se le administra a una persona que usa drogas, es decir, detecta el 98% de los usuarios de drogas. De manera similar, si la persona no usa droga alguna, la prueba arroja un resultado negativo en el 99% de los casos.
C:\My Documents\Cursos\M 5001\1.04.Teorema de Bayes.doc pag. 2

Pregunta Se selecciona un empleado al azar, se le administra la prueba y se obtiene un resultado positivo. Cul es la probabilidad de que la persona sea un usuario de drogas? En este ejemplo tambin podemos representar los datos mediante un diagrama de rbol. Para simplificar el trabajo, denotamos por U el evento de que la persona sea un usuario de drogas, por Pos el evento de que la prueba resulte positiva y por Neg el evento de que la prueba resulte negativa. En el lenguaje de la epdemiologa, al por ciento de personas de la poblacin de inters que poseen la caracterstica deseada, en este caso usuarios de drogas, se le llama la prevalencia. En este ejemplo la prevalencia del uso de drogas es del 1%. A la capacidad de una prueba para detectar aquellas personas que poseen la caracterstica de inters se le llama la sensitividad de la prueba. La sensitividad describe el por ciento de personas cuyo resultado de la prueba sera positivo de entre aquellas que poseen la caracterstica deseada, en este caso, usan drogas. La sensitividad de esta prueba para la deteccin de usuarios de drogas es 98%. Otra medida es la especificidad. Esta indica el por ciento de personas cuyo resultado de la prueba sera negativo de entre aquellas que no poseen la caracterstica deseada, en este caso, usan drogas. La especificidad de esta prueba para la deteccin de usuarios de drogas es 99%. Usamos la notacin que establecimos de estos eventos para escribir las probabilidades asociadas a ellos. As, la prevalencia nos indica que si seleccionamos una persona al azar de entre los 200,000 empleados pblicos, tenemos P(U) = .01. La sensitividad de la prueba nos dice que P(Pos | U) = .98 y de la misma manera la especificidad se traduce a P( Neg | Uc) = .99.1

Comienzo

Usa Drogas? .98 U .01 .99 U


c

Resultado de la prueba Pos Neg Pos Neg

Resultados UPos UNeg UcPos UcNeg

.02 .01 .99

La pregunta que nos interesa contestar es: cunto es P( U | Pos)? Al igual que antes la contestacin a esta pregunta no se puede obtener de forma directa de los datos o del rbol que los representa. Recurrimos nuevamente a la definicin de probabilidad condicional: P( U | Pos) = P(UPos) / P(Pos).

Nota que estas dos ltimas probabilidades no se pueden sumar, ya que son valores obtenidos bajo condiciones distintas, la base de comparacin no es la misma. En el primer caso comparamos la cantidad de resultados positivos del total de usuarios de drogas mientras que en el segundo comparamos la cantidad de resultados negativos del total de personas que no usan drogas.
C:\My Documents\Cursos\M 5001\1.04.Teorema de Bayes.doc pag. 3

Podemos usar el rbol para obtener las cantidades P(UPos) y P(Pos). Siguiendo el mismo proceso de antes, tenemos que P(UPos) = P(U) P( Pos | U), lo que equivale a caminar por el rbol desde la raz hasta la hoja donde obtenemos el resultado UPos. As P(UPos) = .01 .98. Para encontrar P(Pos) vemos que la prueba puede arrojar un resultado positivo cuando la persona es un usuario de drogas o en el caso en que no lo sea. Por esta razn hay dos caminos en el rbol donde obtenemos un resultado positivo de la prueba. Al igual que antes, estos caminos son mutuamente excluyentes. Segn se muestra tambin en el diagrama de al lado, el evento Pos = (UPos) (UcPos) y su probabilidad es P(Pos) = P(UPos) + P(UcPos). El trmino P(UPos) ya haba sido calculado, el segundo se obtiene de forma similar. Obtenemos entonces que P( UcPos) = P(Uc) P(Pos | Uc). Uniendo estos resultados tenemos que P(Pos) = P(U) P( Pos | U) + P(Uc) P(Pos | Uc). Finalmente podemos calcular la probabilidad deseada: P(U | Pos ) =

Pos Uc U Figura 2 Particin de las personas de acuerdo al resultado de la prueba

P(U) P( Pos | U) .01 .98 .0098 = = = .497 c c P(U) P( Pos | U) + P(U ) P(Pos | U ) (.01 .98 ) + (.99 .01) .0098 + .0099

La contestacin a la pregunta que hicimos es .497, es decir, la probabilidad de que una persona seleccionada al azar entre los 200,000 empleados sea un usuario de drogas si la prueba da positivo, es .497. Pregunta De la poblacin a la que se administra la prueba, cuntos resultados positivos esperaras observar?cuntos falsos positivos habra? Cmo es posible que con una prueba que tiene una sensitividad y una especificidad tan altas, ms de la mitad de los resultados positivos corresponden a personas que no son usuarios? Esta ltima pregunta se puede contestar examinando cuidadosamente el numerador y el denominador de P(U | Pos). Si no contamos con una prueba de mejor sensitividad y especificidad que sta, qu podemos hacer? Esto quiere decir que no podemos cambiar P(Pos | U) ni P(Neg | Uc). Slo podemos trabajar con P(U). Este valor slo puede cambiar si cambiamos la poblacin de la cual seleccionamos las personas a quienes se administrar la prueba. Pregunta Discute los costos asociados a ofrecer pruebas de drogas a 200,000 personas para detectar a 2,000 usuarios. Hay costos no econmicos? Existe un plan para ayudar a las personas que son usuarios de drogas y a los que reciben un falso positivo? Crees estas pruebas ofrecen una solucin al problema social del uso de drogas? Supongamos que P(U) = .25, encuentra P(U | Pos). Cmo lograras este aumento en P(U) en la realidad?

C:\My Documents\Cursos\M 5001\1.04.Teorema de Bayes.doc

pag. 4

Ejemplo 3 Tenemos una caja con 5 canicas, dos de ellas son rojas y las otras tres son azules. Se selecciona una canica al azar, sin mirarla la guardamos en el bolsillo. Luego seleccionamos otra canica al azar. Esta segunda canica era de color rojo. Cul es la probabilidad de que la primera canica haya sido tambin roja? En la seccin anterior resolvimos una situacin similar imaginando que antes de seleccionar la primera canica, hemos mirado dentro de la caja y removido la canica que observaremos en nuestra segunda tentativa. En efecto, hemos reservado la segunda canica. La primera canica slo puede ser seleccionada de entre las restantes 4 canicas, de las cuales 1 de ellas es roja. Por esta razn la probabilidad deseada es 1/4.

1/4 2/5 3/4

3/5

2/4

2/4

Figura 3. Diagrama de rbol que ilustra el experimento de seleccionar dos canicas de una caja

Como nuestro inters es encontrar un mtodo formal para contestar estas preguntas, procedemos al anlisis formal de la situacin. Para facilitar el trabajo denotamos el evento de que la primera canica seleccionada es roja por R1 y el evento de que la segunda sea roja por R2. Hacemos lo propio para las canicas azules. Entonces la probabilidad que buscamos es P(R1 | R2). La definicin de probabilidad condicional nos permite escribir P(R1 | R2) = P(R1 R2) / P(R2). Para encontrar el numerador usamos nuevamente la definicin de probabilidad condicional y escribimos P(R1 R2) = P(R2 | R1)P(R1). Aqu hemos invertido la condicin. Debemos condicionar en el evento que ocurre primero, pues es la forma natural de realizar el experimento. Ahora calculamos el denominador. Para encontrar P(R2) descomponemos el evento R2 en dos eventos disyuntos, tal como en la figura de al lado: R2 = (B1 R2) (R1 R2). De esta manera obtenemos la probabilidad P(R2) = P(B1 R2) + P (R1 R2).

R1

R2 B1

Figura 4 Particin del color de la segunda canica de acuerdo al color de la primera C:\My Documents\Cursos\M 5001\1.04.Teorema de Bayes.doc pag. 5

Ya habamos encontrado el segundo trmino de arriba, nos falta encontrar el primero. Para esto usamos nuevamente la definicin de probabilidad condicional y obtenemos P(B1 R2) = P(R2 | B1)P(B1). Ahora podemos escribir el denominador P(R2) = P(R2 | R1)P(R1) + P(R2 | B1)P(B1). Finalmente podemos 1 2 1 P( R2 | R1 ) P( R1 ) 4 5 = . escribir el resultado deseado: P( R1 | R2 ) = = P( R2 | R1 ) P( R1 ) + P( R2 | B1 ) P( B1 ) 1 2 2 3 4 + 4 5 4 5 No debe sorprendernos que observamos el mismo resultado que antes. Esto sirve para verificar y justificar el razonamiento que hicimos para obtener la contestacin. Ejemplo 4 En el 1991 los contribuyentes de Puerto Rico sometieron un total de 1,320,600 planillas de contribucin sobre ingresos al Departamento de Hacienda. Los datos se desglosan en la siguiente tabla por nivel de ingreso y si la planilla se somete conjunta o por separado. Nivel de ingreso menos de 20,000 20,000 a 30,000 30,000 a 50,000 50,000 o ms Total Planillas conjuntas rendidas Planillas separadas rendidas (miles) (miles) 457.5 565.7 88.7 84.9 55.3 33.2 20.1 15.2 621.6 699.0 Total 1,023.2 173.6 88.5 35.3 1,320.6

Fuente: Reforma Contributiva en Puerto Rico 1994. Estudio Tcnico. Editorial UPR.

Tabla 1. Desglose de contribuyentes en Puerto Rico en el ao 1991

Pregunta El Secretario de Hacienda selecciona una planilla al azar.Cul es la probabilidad de que la planilla haya sido sometida en forma conjunta si el nivel de ingreso en ella era menor de $20,000? Cul es la probabilidad de que el nivel de ingreso en ella era menor de $20,000 si la la planilla fue sometida en forma conjunta? Para la primera pregunta, nos interesa conocer la probabilidad de que la planilla haya sido sometida en forma conjunta si el nivel de ingreso que refleja es menor de $20,000. Examinamos la primera fila de la Tabla 1. Vemos que de todas las planillas, 1,023,000 reflejan un ingreso menor de $20,000. De esas 457,500 fueron sometidas en forma conjunta, as la probabilidad deseada es: 475.5/1,023.0 = .46. Para contestar la segunda pregunta es necesario comenzar examinando la columna correspondiente a las planillas que se sometieron en forma conjunta. El total que se indica al final de esa columna ser nuestra base de comparacin. Se sometieron 621,600 planillas conjuntas de las cuales 457,500 corresponden a planillas que adems indicaron un ingreso menor de $20,000. Por lo tanto la probabilidad buscada es 475.5/621.6 = .76. Si usamos los resultados obtenidos para describir la poblacin de planillas recibidas, vemos que de las planillas que reflejaron un ingreso menor de $20,000, el 46% correspondian a planillas sometidas en
C:\My Documents\Cursos\M 5001\1.04.Teorema de Bayes.doc pag. 6

forma conjunta. En el otro caso, de todas las planillas sometidas en forma conjunta, el 76% corresponde a planillas que reflejan un ingreso menor de $20,000. Estos dos porcentajes no son lo mismo ni significan lo mismo, reflejan bases de comparacin distintas, lo que exige seamos muy cuidadosos en nuestro anlisis. Cuando tenemos una tabla con datos es muy fcil calcular estas probabilidades condicionales. Aunque en la prctica no usariamos el mtodo de anlisis que nos ofrece la regla de Bayes para analizar estas situaciones, procedemos a hacerlo para ilustrar su desarrollo. El fin que perseguimos es de presentar el anlisis en una forma anloga a los problemas anteriores para de ah obtener la regla deseada. Denotemos por C el evento de que la planilla se somete en forma conjunta, por S el evento de que la planilla se somete por separado y por I el ingreso reflejado en la planilla.Usando probabilidad condicional podemos escribir as: P( C { I < $20,000}) P( C { I < $20,000}) = . P( { I < $20,000}) P({ C { I < $20,000}} { S { I < $20,000}}) P( C { I < $20,000}) . = P( C { I < $20,000}) + P( S { I < $20,000}) P( C | I < $20,000) = Podemos usar nuevamente la definicin de probabilidad condicional para reescribir el denominador: P(C{I< $20,000}) = P(I< $20,000 | C) P(C) y P(S{I< $20,000}) = P(I< $20,000 | S) P(S). As escribimos P( I < $20,000 | C ) P(C ) . P( C | I < $20,000) = P( I < $20,000 | C)P(C) + P( I < $20,000 | S) P( S ) Pregunta Representa estos datos usando un diagrama de Venn. Obviamente si lo nico que nos interesa es contestar las preguntas que nos hicimos en cada uno de los ejemplos, no hubiramos procedido a desarrollar estas ideas. De hecho, en el ejemplo de las planillas de contribucin y en el de las canicas era mucho mas fcil y directo resolverlos sin hacer alusin a esta metodologa mas formal. En situaciones prcticas no lo haramos. Sin embargo, para el descubrimiento y desarrollo de resultados generales en las matemticas es necesario pasar por este proceso que nos ayuda a identificar los elementos importantes del problema. Debemos calcular una probabilidad condicional cuyo valor no se puede obtener directamente de los datos. A travs de la definicin, expresamos esa probabilidad condicional en trminos de otros eventos cuyas probabilidades s conocemos o podemos calcular. Finalmente, descomponemos el evento deseado, sin condicin alguna, en la unin de eventos disyuntos cuyas probabilidades conocemos y calculamos la probabilidad buscada. Antes de continuar debemos formalizar el resultado que nos facilita el clculo de la probabilidad del evento descompuesto en partes disyuntas.

C:\My Documents\Cursos\M 5001\1.04.Teorema de Bayes.doc

pag. 7

Teorema 1 (Frmula de la probabilidad total) Sea S un espacio muestral, P una medida de probabilidad en S y B un evento en S. Sea A1, A2, , An una particin de S, es decir, eventos disyuntos tal que S = U Ai , entonces
i =1 n

A2

A3

A4

A5

P( B) =

P( A ) P( B | A ) .
i =1 i i

B
A1 A6

Prueba. Podemos escribir, usando el hecho de que A1, A2, , An es una particin de S, tenemos que B = B S = B ( U Ai ) =
i =1 n

U ( B A ) . Usamos el hecho
i i =1 n

Figura 5 Particin del evento B

de que cada uno de los eventos BAi, i = 1, , n son disyuntos y la definicin de probabilidad condicional para calcular la probabilidad de B: P(B) = P(U ( B Ai )) = P( B Ai ) = P( Ai ) P( B | Ai ) .
i =1 i =1 i =1 n n

En la figura de arriba vemos la particin de B. En este ejemplo, cada trmino B Ai i = 1, 2, 3, 4, 5, 6 corresponde a cada uno de los "pedacitos" en que dividimos a B. vemos en la figura que la interseccin de A6 con el evento B es vaca, por lo cual P(B A6) = 0. Para calcular la probabilidad de cada pedacito, usamos la definicin de probabilidad condicional, as P(B Ai)=P(B | Ai)P(Ai), i = 1, 2, 3, 4, 5, 6. Imaginemos que la figura 5 representa un tablero de dardos y que la probabilidad de caer en determiando regin del tablero es igual a su rea. Tiramos el dardo y sabemos que cay en la regin marcada por B, entonces, cul es la probabilidad de que haya caido en A2? Para contestar esta pregunta necesitamos la regla de Bayes. Teorema 2 (Regla de Bayes) Sea S un espacio muestral, P una medida de probabilidad en S y B un evento en S. Sea A1, A2, , An una particin de S, entonces para cada i = 1, 2, 3, ..., n tenemos P ( Ai ) P( B | Ai ) . P( Ai | B) = n P( A j ) P( B | A j )
j =1

Prueba.

Dela definicin de probabilidad condicional tenemos P( Ai | B) =

P( B Ai ) . Para calcular el P( B) numerador usamos la defincin de nuevo y obtenemos P( B Ai ) = P( B | Ai ) P( Ai ). El denominador se obtiene aplicando la Frmula de probabilidad total, as obtenemos el resultado deseado. P( B Ai ) P( Ai ) P( B | Ai ) P( Ai ) P( B | Ai ) P( Ai | B) = = = n . P( B) P( B) P( Aj ) P( B | Aj )
j =1

C:\My Documents\Cursos\M 5001\1.04.Teorema de Bayes.doc

pag. 8

Pregunta Expresa los problemas presentados en los ejemplos 1,2, 3 y 4 en trminos de la regla de Bayes. Indica a qu corresponden la particin y el evento B.

Problemas y ejercicios
1. Una fbrica tiene tres mquinas para producir bombillas. La mquina A produce el 35% del total de bombillas, la mquina B produce el 50% y la mquina C produce el 15% de las bombillas. Sin embargo, las mquinas no son perfectas, la mquina A daa el 10% de las bombillas que produce. La mquina B daa el 5% y la mquina C daa el 20%. a. Representa estos datos en un diagrama de rbol. b. La fbrica produce 10,000 bombillas sin defectos en un da. Cuntas de stas corresponden a la mquina A? Cuntas daa en un da? c. Si seleccionamos una bombilla de la mquina C, cul es la probabilidad de que est defectuosa? d. Luego de fabricadas, pero antes de probarlas, las bombillas se colocan juntas en un saln. Si se selecciona una bombilla al azar, cul es la probabilidad de que est defectuosa? e. Si se comprueba que una bombilla est defectuosa, cul es la probabilidad de que provenga de la mquina B? 2. Una muestra de 400 adultos varones con angina de pecho son clasificados por peso y estatura como sigue: Peso (libras) Edad (aos) 130-149 150-169 170-189 190 o ms 10 20 20 40 30-39 10 15 50 70 40-49 5 15 50 40 50-59 5 10 15 25 60-69 Un individuo se selecciona al azar de entre los 400 participantes. Encuentra la probabilidad de que: a. tiene entre 40-49 aos de edad b. est en el intervalo de 40-49 aos y pesa 170-189 libras c. est en el intervalo 40-49 aos entre 60-69 aos d. est en el intervalo 30-39 o 50-59 aos y pesa 150-169 libras e. pesa menos de 170 libras f. pesa menos de 190 libras y es mayor de 49 aos g. pesa menos de 170 libras dado que es menor de 50 aos h. Son los eventos {tiene 60-69 aos} , {pesa 130-149 libras} independientes? Explica. i. Son los eventos {tiene 50-59 aos} , {pesa 130-149 libras} mutuamente excluyentes? Explica. 3. Un estudio neurolgico sobre la relacin entre la presin sangunea alta y la incidencia de derrame cerebral encontr que: a. para personas mayores de 70 aos, el 10% tendr un derrame dentro de los prximos cinco aos b. de todos los pacientes de 70 aos o ms que han tenido un derrame, el 40% tena presin alta c. para personas de 70 aos o mas que no ha sufrido de derrame, el 20% tiene presin alta.

C:\My Documents\Cursos\M 5001\1.04.Teorema de Bayes.doc

pag. 9

Un paciente de 74 aos visita a su mdico y ste le encuentra con la presin alta. Cul es la probabilidad de que sufra un derrame cerebral en los prximos cinco aos?

C:\My Documents\Cursos\M 5001\1.04.Teorema de Bayes.doc

pag. 10

You might also like