Professional Documents
Culture Documents
Tarea 1. Entropa
Bolaos, Ana Isabel
aibolanosm@uqvirtual.edu.co
Universidad del Quindo
() ()
(/) (/)
(, )
() (/)
(; )
Dibuje el diagrama de Venn para las cantidades en los numerales (a) a (e)
Realice un programa en Matlab que genere un par de variables aleatorias con las probabilidades conjuntas de la
Tabla 1. Compruebe las cantidades encontradas en los numerales (a) a (e).
1 p(x)
\ 0
0
1/2 1/4 3/4
1
0 1/4 1/4
p(y) 1/2 1/2
1
3 1
1 1
1
()
3
4 1
() = 2 + 2 4 = 0.31125 + 0.5 = 0.81125
4
3 4
1
1
() = 2 2 + 2 2 = 0.5 + 0.5 = 1
2
2
(b) La entropa condicional est dada por:
(/) = ( = )(/ = )
(/) = ( = )(/ = )
1
1
1 1
1
(/) = (1,0) + ( , ) =
2
2
2 2
2
3
2 1
1
(/) = ( , ) + (0,1) = 0.6887
4
3 3
4
(c) La entropa conjunta est dada por:
(, ) = () + (/) = () + (/)
(, ) = 0.81125 + 0.6887 = 1.49995
(d) () (/) = 1 0.6887 = 0.3113
(e) La informacin mutua est dada por:
(; ) = () + () (, ) = 0.81125 + 1 1.49995 = 0.3113
(f) Diagrama de Venn
H(X,Y)=1.5 bits
H(X)
H(Y)
I(X;Y)
0.3113 bits
H(X/Y) = 0.5 bits
Funcin entropa_TI
function H = entropia_TI(x)
%Funcin que calcula la entropa y recibe un vector de probabilidades como
%parmetro
H= sum(-(x(x>0).*(log2(x(x>0)))));
end
Resultados Obtenidos
V.A. X
Value Count
0 74939
1 25061
V.A. Y
Value Count
0 50016
1 49984
Percent
74.94%
25.06%
Percent
50.02%
49.98%
Distribucin Conjunta
a=
0.5002 0.2492
0
0.2506
Probabilidades
px =
0.7494 0.2506
py =
0.5002 0.4998
Entropia de X
Hx =
0.8122
Entropia de Y
Hy =
1.0000
Entropa de X dado Y: H(X/Y)
Hxdadoy =
0.4998
Entropa de Y dado X: H(Y/X)
Hydadox =
0.6876
H(X,Y)
Hxy =
1.4998
I(X;Y)
Ixy =
0.3124
2. En la serie final de la NBA se encuentran dos equipos R y T. Gana la serie el equipo que consiga ganar 4 partidos.
Sea X una variable aleatoria que representa la serie, por ejemplo RRRR, o RTRTRTR, y considere Y el nmero
de juegos realizados, que va de 4 a 7. Asumiendo que cada equipo tiene igual oportunidad de ganar, y que los
juegos son independientes, calcule:
(a)
(b)
(c)
(d)
(e)
() ()
(/) (/)
(, )
() (/)
(; )
= .
= . : 4, 5, 6 7
De acuerdo a las condiciones del problema, hay dos formas en las cuales la Serie Final de la NBA slo dure cuatro
juegos y es cuando alguno de los dos equipos gane los 4 partidos, es decir, RRRR y TTTT.
Para que la serie dure 5 juegos, existen ocho posibilidades:
RRRTR
RRTRR
RTRRR
TRRRR
TTTRT
TTRTT
TRTTT
RTTTT
Se puede observar que para ganar la serie cada equipo debe ganar el ltimo juego y tres de los partidos restantes. Por
ejemplo, una serie puede durar 6 juegos si el ganador gana tres de los cinco primeros juegos y gana el ltimo. Cuando
el nmero de juegos aumenta ya no es tan fcil visualizar las posibilidades, por esta razn se recurre a la distribucin
binomial negativa, donde la variable aleatoria X representa el nmero de pruebas de Bernoulli (pruebas
independientes en las cuales slo se puede obtener un resultado: xito o fracaso) hasta que ocurra el r-simo xito,
incluyendo la prueba en que ocurre ste (Spiegel, Schiller, & Srinivasan, 2014).
1
() = ( = ) = (
) : = , + 1,
1
En el problema de estudio se toma como xito que cualquiera de los equipos gane el partido y la probabilidad para que
esto suceda es de ya que slo hay dos posibilidades: ganar o perder.
( = ) = probabilidad de que ocurran r xitos en k partidos y que el ltimo de ellos que es el r-simo, ocurra en
el k-simo partido que es el ltimo.
= nmero de xitos, que sera igual a 4 que corresponden a los 4 partidos que se deben ganar
= nmero de partidos para obtener r xitos, k tomara valores de 4, 5, 6 y 7
= p (xito)=1/2
= p (fracaso) = 1-p = 1/2
41
3
( = 4) = (
) (1/2)4 (1/2)44 = ( ) (1/2)4 (1/2)0 = 1(1/2)4 = 1/16
41
3
4
51
( = 5) = (
) (1/2)4 (1/2)54 = ( ) (1/2)4 (1/2)1 = 4(1/2)5 = 1/8
3
41
61
5
( = 6) = (
) (1/2)4 (1/2)64 = ( ) (1/2)4 (1/2)2 = 10(1/2)6 = 5/32
41
3
71
6
( = 7) = (
) (1/2)4 (1/2)74 = ( ) (1/2)4 (1/2)3 = 20(1/2)7 = 5/32
41
3
Se debe tener en cuenta que al ser dos equipos los que tienen la posibilidad de ganar la serie mundial, los resultados
posibles de la serie deben duplicarse.
Si = . = 70
1
16
1
8 () =
32
=
1
20 () =
64
1
40
()
=
{
128
2 () =
1
1
1
1
1 5 15 35 93
2 16 + 8 2 32 + 20 2 64 + 40
2 128 = + +
+
=
= 5.8125
16
32
64
128
2 4 8 16 16
1
1
5
16 5
16 3 1
() = 2 8 + 2 4 + 2
+ 2
= + + 0.5243 + 0.5243 = 1.9238
8
4
16
5 16
5
8 2
H(X) = H(X,Y)
H(X/Y)
H(Y)
I(X;Y)
(, ) = () + (/) = () + (/)
(/) = (, ) () = 5.8125 1.9238 = 3.8887
= cos( 10 )
(1 , 2 , , ) = ( |1 , , 1 )
=1
(, ()) = () + (()|)
Como se haba indicado anteriormente (()|) es la cantidad de incertidumbre en () si se conoce , como ()
es una funcin de , esta incertidumbre es cero.
(()|) = 0
(, ()) = ()
Si se aplica nuevamente la regla de la cadena, se tiene:
(, ()) = (()) + (|())
(|()) 0, la igualdad se da cuando es una funcin de () o () es una funcin inyectiva.
(, ()) (())
() (())
() ()
De acuerdo a lo anterior, se deduce que si es una funcin de la variable aleatoria , pueden ocurrir dos cosas con
(), que se reduzca o que se haga igual a ().
(b) Si graficamos = , se obtiene:
Y=e^X
25
20
15
10
5
0
-4
-3
-2
-1
Como se indic en el literal (a) la igualdad se da cuando () es una funcin inyectiva, as que lo que se debe analizar
es el comportamiento de la funcin.
= es una funcin inyectiva porque no existen dos puntos en los que la funcin toma el mismo valor (Salas &
Hille, 1984), por lo tanto () = ().
Y=cos(X*Pi/10)
1,5
1
0,5
0
-30
-20
-10
10
20
30
-0,5
-1
-1,5
Se puede observar que no corresponde a una funcin inyectiva, por lo tanto () < ().
4. Queremos identificar un objeto aleatorio ~(). Se realiza una pregunta aleatoria ~(), independiente de .
El resultado es una respuesta determinista = (, ) {1 , 2 , }. Demuestre que (; , ) = (/).
Interprete este resultado. Demuestre que realizar dos preguntas tiene menos valor que el doble de una sola.
(; , ) = (/)
(; , ) = (, ) (, |)
(; , ) = () + (|) (, |)
(; , ) = () + (|) (|) (|, )
(; , ) = () + (|) () (|, )
(; , ) = () + (|) ()
(; , ) = (|)
(; ) = () (|)
(, ) = () + (|)
(, |) = (|) + (|, )
(; ) = () (|) => Si y son
independientes, entonces (; ) = 0, por lo tanto
() = (|). Para el ejercicio ~() es
independiente de , entonces (|) = ().
El resultado es una respuesta determinista
=
(, ) {1 , 2 , }, por lo tanto, (|, ) = 0
La reduccin en la incertidumbre de debido a , es
igual a la cantidad de incertidumbre de si se conoce
Para demostrar que realizar dos preguntas tiene menos valor que el doble de una sola, se procede de la siguiente manera:
(; 1 , 1 , 2 , 2 ) = (; 1 ) + (; 1 |1 ) + (; 2 |1 , 1 ) + (; 2 |1 , 1 , 2 )
(; 1 , 1 , 2 , 2 ) = (; 1 |1 ) + (; 2 |1 , 1 ) + (; 2 |1 , 1 , 2 )
(; 1 , 1 , 2 , 2 ) = (; 1 |1 ) + (2 |1 , 1 ) (2 |, 1 , 1 ) + (; 2 |1 , 1 , 2 )
Se aplica Regla
de la Cadena
y 1 son
independientes
2
es
independiente de
, 1 , 1
(; 1 , 1 , 2 , 2 ) = (; 1 |1 ) + (; 2 |1 , 1 , 2 )
(; 1 , 1 , 2 , 2 ) = (; 1 |1 ) + (2 |1 , 1 , 2 ) (2 |, 1 , 1 , 2 )
La cantidad de
incertidumbre
de 2
si
se
conoce , 2 es
cero
La cantidad de
incertidumbre en
2
(segunda
pregunta)
es
menor porque ya
se realiz la
primera pregunta
Se aplica lo
demostrado en el
literal (a)
(; 1 , 1 , 2 , 2 ) = (; 1 |1 ) + (2 |1 , 1 , 2 )
(; 1 , 1 , 2 , 2 ) (; 1 |1 ) + (2 |2 )
(; 1 , 1 , 2 , 2 ) 2(; 1 |1 )
5. Dada una variable aleatoria X con tres posibles valores [a, b, c], considere las dos distribuciones mostradas en la
Tabla 2, y calcule:
(a) () ()
(b) (||) (||)
a
b
c
p(x)
1/2
1/4
1/4
q(x)
1/3
1/3
1/3
(a) () ()
1
2
() = 2 2 + 2 4 = 0.5 + 1 = 1.5
2
4
3
() = 2 3 = 1.5850
3
(b) (||) (||)
(||) = ()2
()
()
1
1
1
2
1
3 2
3
2
(||) = 2 + 2 4 = 2 + 2 = 0.2924 0.2075 = 0.0848
1 4
1 2
2
2 4
4
3
3
1
1
1
1
1
1
1
2 1
4 1
4
3
3
(||) = 2 + 2 + 2 3 = 2 + 2 + 2 = 0.19499 + 0.27669
1 3
1 3
1 3
3
3 3
3 3
3
2
4
4
= 0.0817
I. BIBLIOGRAFA
Cover, T., & Thomas, J. (2006). Elements of Information Theory. Hoboken, New Jersey: John Wiley & Sons, Inc.
Salas, S. L., & Hille, E. (1984). Calculus de una y varias variables con Geometra analtica. Caracas: Editorial Reverte
Venezolana. S. A.
Spiegel, M. R., Schiller, J., & Srinivasan, R. (2014). Probabilidad y estadstica. Naucalpan de Jurez: Mc Graw Hill.
10