You are on page 1of 144

Mtodos Probabilsticos e Estatsticos para

Engenharias e Cincias Exatas


Marcilia Andrade Campos Leandro Chaves Rgo
18 de Agosto de 2010
Lista de Smbolos
IN conjunto dos nmeros naturais
Z conjunto dos nmeros inteiros
Z
+
conjunto dos nmeros inteiros positivos
I Q conjunto dos nmeros racionais
IR conjunto dos nmeros reais
I C conjunto dos nmeros complexos
a, b, x, y nmeros reais
x vetor real
A -lgebra
B -lgebra de Borel
espao de resultados elementares, espao amostral
evento simples, resultado elementar
A, B eventos aleatrios, eventos
A
c
ou A evento complementar de A
P(A) probabilidade de A
P(A | B) probabilidade condicional de A dado B
X, Y , Z variveis aleatrias
(X
1
, , X
n
) ou X
1
, , X
n
amostra aleatria simples
iid variveis aleatrias independentes e identicamente distribudas
f funo densidade
f
X
funo densidade da varivel aleatria X
F funo de distribuio acumulada ou funo de distribuio
F
X
funo de distribuio da varivel aleatria X
F

X
funo de distribuio do vetor aleatrio

X

X vetor aleatrio
se distribui, a varivel aleatria tem distribuio
aproximadamente igual
= diferente
conjunto vazio
||A|| cardinalidade, tamanho ou dimenso do conjunto A
innito
se e somente se
limite de seqncia monotnica no-decrescente
limite de seqncia monotnoca no-crescente
implica
i
incluso
incluso estrita
interseo
unio
e
ou
no
pertence
no pertence
< menor
> maior
menor ou igual
maior ou igual
para todo ou qualquer que seja
existe
equivalente
: tal que
P(A), 2
A
conjunto das partes de A
| | valor absoluto
A
k
n
, (n)
k
arranjo de n elementos tomados k deles
C
k
n
ou
_
n
k
_
combinao de n elementos tomados k deles
! fatorial
ii
Contedo
1 Introduo Probabilidade 1
1.1 Conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1 Operaes com Conjuntos . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.2 Produto Cartesiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.1.3 Conjunto das Partes . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.1.4 Partio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.1.5 Funo Indicadora . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2 Breve Histrico sobre o Estudo da Chance e da Incerteza . . . . . . . . . . . 7
1.3 Experimento Aleatrio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.4 Espao Amostral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.5 Eventos e Coleo de Eventos . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.6 Fundamentos de Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.6.1 Hierarquia de Conceitos Estruturais de Probabilidade . . . . . . . . . 14
1.6.2 Interpretaes de Probabilidade . . . . . . . . . . . . . . . . . . . . . 15
1.7 Frequncia Relativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.8 Axiomas de Kolmogorov . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.8.1 Exemplos de Medidas de Probabilidade . . . . . . . . . . . . . . . . . 19
1.8.2 Propriedades de uma Medida de Probabilidade . . . . . . . . . . . . . 23
1.9 Aprendendo um pouco mais . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
1.10 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
2 Espaos Amostrais Finitos 35
2.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.2 Regra da Adio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.3 Regra da Multiplicao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.4 Amostragem ou Escolhas com ou sem Reposio . . . . . . . . . . . . . . . . 37
2.5 Permutaes e Arranjos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.6 Combinaes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.7 Aplicaes em Grafos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
2.7.1 Grafos No Direcionados . . . . . . . . . . . . . . . . . . . . . . . . . 41
2.7.2 Grafos Direcionados . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
2.8 Contagem Multinomial ou Permutao com Elementos Repetidos . . . . . . 42
2.9 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
iii
3 Probabilidade Condicional. Independncia 48
3.1 Probabilidade Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
3.2 Independncia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
3.3 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
4 Variveis Aleatrias Unidimensionais e Funes 68
4.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
4.2 Funo de Distribuio Acumulada . . . . . . . . . . . . . . . . . . . . . . . 69
4.3 Tipos de Variveis Aleatrias . . . . . . . . . . . . . . . . . . . . . . . . . . 72
4.3.1 Varivel Aleatria Discreta . . . . . . . . . . . . . . . . . . . . . . . . 72
4.3.2 Varivel Aleatria Contnua . . . . . . . . . . . . . . . . . . . . . . . 73
4.3.3 Varivel Aleatria Singular . . . . . . . . . . . . . . . . . . . . . . . . 74
4.3.4 Decomposio de uma Varivel Aleatria . . . . . . . . . . . . . . . 75
4.4 Funes de Variveis Aleatrias . . . . . . . . . . . . . . . . . . . . . . . . . 75
4.5 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
5 Vetores Aleatrios e Funes 89
5.1 Introduo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
5.2 Funo de Distribuio Acumulada Conjunta . . . . . . . . . . . . . . . . . . 89
5.2.1 Vetor Aleatrio Discreto . . . . . . . . . . . . . . . . . . . . . . . . . 91
5.2.2 Vetor Aleatrio Contnuo . . . . . . . . . . . . . . . . . . . . . . . . . 91
5.3 Distribuies Marginais e Condicionais . . . . . . . . . . . . . . . . . . . . . 92
5.4 Independncia entre Variveis Aleatrias . . . . . . . . . . . . . . . . . . . . 95
5.5 Funes de Vetores Aleatrios . . . . . . . . . . . . . . . . . . . . . . . . . . 97
5.5.1 Distribuio de Z = X + Y . . . . . . . . . . . . . . . . . . . . . . . 98
5.5.2 Distribuio de Z = XY . . . . . . . . . . . . . . . . . . . . . . . . 100
5.5.3 Distribuio de Z =
Y
X
. . . . . . . . . . . . . . . . . . . . . . . . . . 101
5.5.4 Jacobiano de uma Funo . . . . . . . . . . . . . . . . . . . . . . . . 105
5.6 Aprendendo um pouco mais... . . . . . . . . . . . . . . . . . . . . . . . . . . 106
5.6.1 Extenso do Mtodo Jacobiano para o Clculo de Densidades de Fun-
es de Vetores Aleatrios Quaisquer . . . . . . . . . . . . . . . . . . 107
5.6.2 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
6 Esperana e outros Momentos 115
6.1 O Conceito de Esperana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
6.2 Denio da Esperana . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
6.3 Esperana de Funes de Variveis Aleatrias . . . . . . . . . . . . . . . . . 116
6.3.1 Caso Discreto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
6.3.2 Caso Contnuo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
6.4 Propriedades da Esperana . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
6.5 Momentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 120
6.5.1 Momentos Centrais. Varincia . . . . . . . . . . . . . . . . . . . . . . 121
6.5.2 Propriedades da Varincia e de outros Momentos . . . . . . . . . . . 122
6.6 A Desigualdade de Tchebychev . . . . . . . . . . . . . . . . . . . . . . . . . 124
iv
6.7 Momentos Conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125
6.8 Esperana Condicional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
6.9 Aprendendo um pouco mais... . . . . . . . . . . . . . . . . . . . . . . . . . . 128
6.9.1 As integrais de Riemman-Stieltjes e de Lebesgue-Stieltjes . . . . . . . 128
6.9.2 Propriedades da Integral de Lebesgue-Stieltjes . . . . . . . . . . . . . 130
6.9.3 Denio da Esperana - Caso Geral . . . . . . . . . . . . . . . . . . 132
6.9.4 Interpretao Geomtrica da Esperana . . . . . . . . . . . . . . . . . 133
6.10 Exerccios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
v
Captulo 1
Introduo Probabilidade
1.1 Conjuntos
Denio 1.1.1: Um conjunto uma coleo de elementos distintos
1
onde os elementos
no so ordenados.
Esta denio intuitiva de um conjunto foi dada primeiramente por Georg Cantor (1845-
1918), que criou a teoria dos conjuntos em 1895. Um conjunto pode ser especicado, listando
seus elementos dentro de chaves. Por exemplo,
A = {0, 1, 2, 3, 5, 8, 13}, B = {0, 1, 2, . . . , 1000}.
Alternativamente, um conjunto pode ser especicado por uma regra que determina seus
membros, como em:
C = {x : x inteiro e positivo} ou D = {x : x par}.
Como em um conjunto a ordem dos elementos no importa, tem-se que:
{1, 2, 3} = {2, 3, 1}.
Se um dado elemento faz parte de um conjunto, diz-se que ele pertence ao conjunto e
denota-se isso com smbolo . Por exemplo, 2 D = {x : x par} ou 3 E = {x :
primo }.
Por outro lado, se um dado elemento no faz parte de um conjunto, diz-se que ele no
pertence ao conjunto e denota-se isso com o smbolo / . Por exemplo, 3 / D = {x : x par}
ou 4 / E = {x : x primo}.
preciso ter cuidado ao distinguir entre um elemento como 2 e o conjunto contendo
somente este elemento {2}. Enquanto, tem-se 2 F = {2, 3, 5}, {2} / F = {2, 3, 5}, pois o
conjunto contendo somente o elemento 2 no pertence F.
1
Na Estatstica comum se falar de conjuntos incluindo o caso onde seus elementos no so distintos.
Por exemplo, o conjunto dos tempos de acesso a um banco de dados, o conjunto das notas de uma dada
disciplina, entre outros, pode ter valores iguais
1
1.1. CONJUNTOS 2
Exemplo 1.1.2: Seja G = {2, {3}}. Ento, 2 G e {3} G, porm 3 / G.
O tamanho de um conjunto A, ||A||, a quantidade de elementos que ele possui, a qual
chamada de sua cardinalidade. A cardinalidades pode ser nita, innita enumervel, ou
innita no-enumervel. Um conjunto nito quando existe uma funo bijetiva cujo dom-
nio igual a este conjunto e a imagem o conjunto dos inteiros no-negativos menores que
um nmero nito; seus elementos podem ser contados, sendo possvel exibir seu ltimo ele-
mento. Um conjunto innito enumervel tem exatamente a mesma quantidade de elementos
que os naturais, ou seja, existe uma funo bijetiva cujo domnio igual a este conjunto e
a imagem igual ao conjunto dos naturais. Um conjunto enumervel se ele for nito ou
innito enumervel. Um conjunto no-enumervel se ele no for enumervel. Por exemplo,
os seguintes conjuntos so enumerveis:
N
n
= {0, 1, 2, . . . , n 1},
Z = {x : x um inteiro},
Z
+
= {x : x um inteiro positivo},
Q = {x : x racional}.
Para notar que o conjunto dos nmeros racionais enumervel considere a seguinte matriz
de nmeros racionais. (Lembrando que um nmero x racional se pode ser escrito sob a
forma
p
q
, onde p e q so inteiros e q = 0.)
0/1 0/2 0/3

1/1 1/2 1/3

2/1 2/2 2/3

3/1 3/2 3/3

.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Esta matriz contm todos os racionais no-negativos. Utilizando o mtodo da diagonali-
zao, os elementos da matriz so ordenados, sem repetio, da seguinte forma:
0/1, 1/1, 1/2, 2/1, 1/3, 3/1, . . .
Denindo-se uma correspondncia f onde para cada racional no-negativo r, f(r) repre-
senta a posio em que r aparece na sequncia acima, tem-se que f uma correspondncia 1-1
entre os racionais no-negativos e os naturais. Por exemplo, temos que f(1/2) = 3, f(3) = 6.
Pode-se denir g no conjunto de todos os racionais tal que tal que g(r) = 2(f(r) 1) se
r > 0, e g(r) = 2f(|r|) 1 se r 0. Desse modo, g(r) um natural par se r for um raci-
onal positivo, e um natural mpar, se r for um racional no-positivo. Portanto, g(r) uma
correspondncia 1-1 entre os racionais e os naturais, o que implica que os racionais formam
um conjunto enumervel.
Campos & Rgo
1.1. CONJUNTOS 3
Por outro lado, os conjuntos abaixo so no-enumerveis:
IR = {x : x um nmero real},
(a, b) = {x : a < x < b}, onde a < b,
[a, b] = {x : a x b}, onde a < b.
Em muitos problemas o interesse estudar um conjunto denido de objetos. Por exemplo,
o conjunto dos nmeros naturais; em outros, o conjuntos dos nmeros reais; ou ainda, por
todas as peas que saem de uma linha de produo durante um perodo de 24h, etc. O
conjunto que contm todos os elementos objeto de estudo chamado de conjunto universo e
denotado por . Por outro lado, o conjunto especial que no possui elementos chamado
de conjunto vazio e denotado por . Este conjunto tem cardinalidade 0 e portanto nito.
Por exemplo,
= {} = {x : x IR e x < x} ou = (a, a).
Dois conjuntos A e B podem ser relacionados atravs da relao de incluso, denotada
por A B, e lida A um subconjunto de B ou B contm A, quando todo elemento de A
tambm elemento de B. Diz-se que A um subconjunto prprio de B quando se tem A B,
A = , e B A. Se A subconjunto de B, ento B chamado um superconjunto de A.
Diz-se que A e B so iguais se e somente se A B e B A. Se A B, ento tambm
pode-se dizer que B A.
A relao possui as propriedades de (i) reexividade (A A); (ii) transitividade
(A B, B C A C); e anti-simetria (A B, B A A = B). Contudo, ela no
uma relao completa, ou seja, no verdade que, para todos os conjuntos A e B, ou A B,
ou B A. Tambm fcil vericar que A e A para todo conjunto A.
1.1.1 Operaes com Conjuntos
Conjuntos podem ser transformados atravs das seguintes operaes:
(i) Complementao: A
c
= { : / A}. De acordo com esta denio, para todo
e todo conjunto A, no existe outra opo alm de A ou A
c
; alm disso
no pode ser verdade que A e A
c
simultaneamente.
(ii) Unio: A B = { : A ou B}.
(iii) Interseco: A B = { : A e B}.
(iv) Diferena: AB = A B
c
= { : A e / B}.
Se A B = , ento A e B no tm qualquer elemento em comum, e diz-se ento que A
e B so disjuntos.
Exemplo 1.1.3: Seja = {0, 1, 2, 3, 4, 5, 6, 7}, A = {0, 1, 5} e B = {1, 2, 3, 4}. Ento,
A
c
= {2, 3, 4, 6, 7}, A B = {0, 1, 2, 3, 4, 5}, A B = {1}, AB = {0, 5}.
Campos & Rgo
1.1. CONJUNTOS 4
Exemplo 1.1.4: SejamA, B, C e D subconjuntos do conjunto universo tal que AB = ,
C D = , A C e B D. Prove que A = C e B = D.
Soluo: Basta provar que C A e D B. Seja C, ento como C D = , tem-se
que / D. Logo, como B D, segue que / B. Mas como AB = , tem-se que A.
Portanto, C A.
Para provar que D B, seja D, ento como C D = , tem-se que / C. Logo,
como A C, segue que / A. Mas como A B = , tem que B. Portanto, D B.
Relaes e propriedades das operaes entre conjuntos incluem:
(i) Idempotncia: (A
c
)
c
= A.
Prova: Suponha que (A
c
)
c
. Ento, / A
c
, o que por sua vez implica que A,
ou seja, (A
c
)
c
A. Agora suponha que A, ento / A
c
, e portanto (A
c
)
c
,
ou seja, A (A
c
)
c
. Logo, (A
c
)
c
= A.
(ii) Comutatividade (Simetria): A B = B A e A B = B A.
Prova: Suponha que A B. Ento, A, ou B, o que implica que
BA, ou seja, AB BA. Agora suponha que B A. Ento, B, ou
A, o que por sua vez implica que A B, ou seja, B A A B. Portanto,
A B = B A.
A prova para o caso da interseco anloga e deixada como Exerccio.
(iii) Associatividade: A (B C) = (A B) C e A (B C) = (A B) C.
Prova: Exerccio.
(iv) Distributividade: A(BC) = (AB) (AC) e A(BC) = (AB) (AC).
Prova: Exerccio.
(v) Leis de De Morgan: (A B)
c
= A
c
B
c
e (A B)
c
= A
c
B
c
.
Prova: Suponha que (A B)
c
. Ento, / (A B), o que por sua vez implica
que / A e / B. Logo, A
c
e B
c
, ou seja, (A
c
B
c
). Ento,
(A B)
c
(A
c
B
c
). Agora suponha que (A
c
B
c
). Ento, A
c
e B
c
, o
que por sua vez implica que / A e / B. Logo, / (AB), ou seja, (AB)
c
.
Ento, (A
c
B
c
) (A b)
c
. Portanto, (A
c
B
c
) = (A b)
c
.
A prova da outra Lei de De Morgan anloga e deixada como exerccio.
As Leis de De Morgan permitem que se possa expressar unies em termos de interseces
e complementos e interseces em termos de unies e complementos.
Unies e interseces podem ser estendendidas para colees arbitrrias de conjuntos.
Seja I um conjunto qualquer. Este conjunto I ser utilizado para indexar, ou seja, identicar
atravs de um nico smbolo os conjuntos na coleo arbitrria de interesse e desse modo
Campos & Rgo
1.1. CONJUNTOS 5
simplicar a notao utilizada. Por exemplo, se I = {1, 5, 7}, ento
iI
A
i
= A
1
A
5
A
7
;
ou, se I = N, ento
iN
A
i
= A
1
A
2
A
n
.
De modo anlogo ao caso de dois conjuntos, dene-se:

iI
A
i
= { : pertence a pelo menos um dos conjuntos A
i
, onde i I, }
e

iI
A
i
= { : pertence a todo A
i
, onde i I.}
Se I for um conjunto enumravel, diz-se que
iI
A
i
, respectivamente,
iI
A
i
, uma
unio, respectivamente interseco, enumravel de conjuntos.
Por exemplo, se = 0, 1, 2, . . ., I o conjunto de inteiros positivos divisveis por 3 e
N

= {0, 1, 2, . . . , 1}, ento

I
N

= e
I
N

= N
3
.
Exemplo 1.1.5: Se A
i
= [1, 2 +
1
i
), i IN, ento
iIN
A
i
= [1, 3) e
iIN
= [1, 2].
1.1.2 Produto Cartesiano
Denio 1.1.6: Produto Cartesiano. O produto Cartesiano AB de dois conjuntos
dados A e B o conjunto de todos os pares ordenados de elementos, onde o primeiro pertence
A e o segundo pertence B:
A B = {(a, b) : a A, b B}.
Por exemplo, se A = {1, 2, 3} e B = {c, d}:
AB = {(1, c), (1, d), (2, c), (2, d), (3, c), (3, d)}
e
B A = {(c, 1), (c, 2), (c, 3), (d, 1), (d, 2), (d, 3)}.
O produto cartesiano de dois conjuntos pode ser estendido para n conjuntos da seguinte
maneira: se A
1
, . . . , A
n
forem conjuntos, ento,
A
1
A
2
. . . A
n
= {(a
1
, a
2
, . . . , a
n
) : a
i
A
i
},
ou seja, o conjunto de todas as nuplas ordenadas.
Um caso especial importante o produto cartesiano de um conjunto por ele prprio, isto
, AA. Exemplos disso so o plano euclideano, IRIR, e o espao euclideano tridimensional,
representado por IR IR IR.
Campos & Rgo
1.1. CONJUNTOS 6
1.1.3 Conjunto das Partes
Denio 1.1.7: Dado um conjunto qualquer A, pode-se denir um outro conjunto, conhe-
cido como conjuntos das partes de A, e denotado por 2
A
, cujos elementos so subconjuntos
de A.
Exemplo 1.1.8: Seja A = {1, 2, 3}, ento
2
A
= {, A, {1}, {2}, {3}, {1, 2}, {1, 3}, {2, 3}}.
Pode-se provar que a cardinalidade do conjunto das partes de qualquer conjunto dado A
maior que a cardinalidade de A.
Teorema 1.1.9: Se A um conjunto e 2
A
o conjunto das partes de A, no existe uma
funo f : A 2
A
que seja sobrejetiva.
Prova: Recorde que uma funo g : D I sobrejetiva se para todo y I, existe x D
tal que g(x) = y. Suponha por contradio, que existe uma funo sobrejetiva f : A 2
A
.
Dena o conjunto, B = {x A : x / f(x)}. Como f por suposio sobrejetiva e
B 2
A
, tem-se que existe b A tal que f(b) = B. Existem dois casos a considerar: b B
ou b B
c
. Se b B, ento b / f(b). Mas como B = f(b), tem-se que b / B, absurdo. Se
b B
c
, ento b f(b). Mas como B = f(b), tem-se que b B, absurdo.
1.1.4 Partio
Intuitivamente, uma partio de um conjunto universo uma maneira de distribuir os ele-
mentos deste conjunto em uma coleo arbitrria de subconjuntos. Formalmente, tem-se a
seguinte denio:
Denio 1.1.10: Dado um conjunto universo , uma partio = {A

, I} de
uma coleo de subconjuntos de (neste caso, indexados por que toma valores no
conjunto de ndices I) e satisfaz:
(i) Para todo = , A

= ;
(ii)
I
A

= .
Deste modo os conjuntos de uma partio so disjuntos par a par e cobrem todo o conjunto
universo. Portanto, cada elemento pertence a um, e somente um, dos conjuntos A

de uma partio.
Exemplo 1.1.11: Se = {1, 2, 3, 4}, ento {A
1
, A
2
}, onde A
1
= {1, 2, 3} e A
2
= {4},
uma partio de .
Exemplo 1.1.12: A coleo de intervalos {(n, n+1] : n Z} uma partio dos nmeros
reais IR.
Campos & Rgo
1.2. BREVE HISTRICO SOBRE O ESTUDO DA CHANCE E DA INCERTEZA 7
1.1.5 Funo Indicadora
sempre conveniente representar um conjunto Apor uma funo I
A
tendo domnio (conjunto
dos argumentos da funo) e contra-domnio (conjunto dos possveis valores da funo)
binrio {0, 1}.
Denio 1.1.13: Funo Indicadora. A funo indicadora I
A
: {0, 1} de um
conjunto A dada por
I
A
() =
_
1, se A,
0, se / A.
fcil observar que I

() = 1, e que I

() = 0, . Note que existe uma


correspondncia 1-1 entre conjuntos e suas funes indicadoras:
A = B ( )I
A
() = I
B
().
O fato que conjuntos so iguais se, e somente se, suas funes indicadoras forem idnticas
permitem explorar a aritmtica de funes indicadoras:
I
A
c = 1 I
A
,
A B I
A
I
B
,
I
AB
= min(I
A
, I
B
) = I
A
I
B
,
I
AB
= max(I
A
, I
B
) = I
A
+ I
B
I
AB
,
I
AB
= max(I
A
I
B
, 0) = I
A
I
B
c ,
para construir argumentos rigorosos no que se refere a relao entre conjuntos. Ou seja,
proposies sobre conjuntos so transformadas em proposies sobre funes indicadoras e
a lgebra pode ser usada para resolver perguntas menos familiares sobre conjuntos.
Exemplo 1.1.14: Utilizando funes indicadoras, verique que A B B
c
A
c
.
Soluo: Tem-se que
A B I
A
I
B
1 I
A
1 I
B
I
A
c I
B
c B
c
A
c
.
1.2 Breve Histrico sobre o Estudo da Chance e da In-
certeza
Antes de comear as denies e propriedades da funo probabilidade, ser dado um breve
histrico a partir do sculo XVI.
...a era dos jogos de azar...
Campos & Rgo
1.2. BREVE HISTRICO SOBRE O ESTUDO DA CHANCE E DA INCERTEZA 8
Cardano (1501-1576).
Primeiro matemtico que calculou uma probabilidade corretamente. Introduziu a
idia de combinaes para calcular o cardinal do espao amostral e do nmero de
eventos elementares favorveis, de modo que o quociente entre ambos os nmeros
desse um resultado que estivesse de acordo com a experincia.
Fermat (1601-1655), Pascal (1623-1662), Huygens (1629-1695).
Um dos primeiros problemas interessantes em probabilidade foi proposto pelo
nobre francs Chevalier de Mr. O problema o seguinte: dois jogadores, A e
B, concordam em jogar uma srie de jogos, s. Por alguma razo acidental, eles
decidem parar o jogo quando A tem ganho m jogos e B, n, sendo m s, n s e
m = n . A pergunta : como as apostas devem ser divididas?
A soluo desse problema envolveu Fermat, Pascal e Huygens.
Huygens (1629-1695).
Huygens publicou em 1657 o primeiro livro sobre Teoria da Probabilidade De
Ratiociniis in Alae Ludo (On Calculations in Game of Chance), o qual foi muito
bem aceito pelos matemticos da poca e foi a nica introduo Teoria da
Probabilidade durante 50 anos.
Ainda datam desse perodo os fundamentos do conceito de esperana matemtica,
o teorema da adio de probabilidades e o teorema da multiplicao de probabi-
lidades.
...o comeo...
James Bernoulli (1654-1705).
Publicou em 1713 Ars Conjectandi (The Art of Guessing), obra dividida em quatro
partes, onde, na ltima, provou o primeiro limite da Teoria da Probabilidade, A
Lei dos Grandes Nmeros, ou Teorema de Ouro.
Pierre Simon, Marqus de Laplace (1749-1827).
Publicou em 1812 Thorie Analytique des Probabilits, no qual apresentou seus
prprios resultados e os de seus predecessores. Suas contribuies mais impor-
tantes foram a (i) aplicao de mtodos probabilsticos aos erros de observaes
e (ii) formulou a idia de considerar os erros de observaes como o resultado
acumulativo da adio de um grande nmero de erros elementares independentes.
Poisson (1781-1840), Gauss (1777-1855).
Ambos tiveram grande interesse por teoremas limite. A Gauss creditada a
origem da Teoria dos Erros, em particular, dos Mnimos Quadrados.
...estamos chegando...
P. L. Chebyshev (1822-1894), A. A. Markov (1856-1922), A. M. Lyapunov
(1857-1918).
Campos & Rgo
1.2. BREVE HISTRICO SOBRE O ESTUDO DA CHANCE E DA INCERTEZA 9
Desenvolveram mtodos efetivos para provar teoremas limite para soma de vari-
veis aleatrias independentes, mas arbitrariamente distribudas. Chebyshev foi o
primeiro a explorar com profundidade as relaes entre variveis aleatrias e suas
esperanas matemticas.
As contribuies de Markov, relacionam-se com teoremas limite para soma de
variveis aleatrias independentes e a criao de um novo ramo da Teoria da
Probabilidade: a teoria das variveis aleatrias dependentes conhecidas como
Cadeias de Markov.
Uma das contribuies de Lyapunov foi o uso da funo caracterstica para provar
o teorema central do limite.
John von Neumann (1903-1957).
Ainda nessa poca, von Neumann assentou sobre bases rmes a Teoria dos Jo-
gos, em 1928, contribuiu para a descoberta da Mecnica Quntica, contribuiu
para o desenvolvimento da primeira bomba atmica americana e ...inventou o
computador digital!
...a axiomatizao...
Lebesgue, deniu a Teoria da Medida e Integrao.
Borel (1871-1956), estabeleu a analogia entre medida de um conjunto e probabili-
dade de um evento e integral de uma funo e esperana matemtica.
A. N. KOLMOGOROV, publicou em 1933 Foundations of the Theory of Proba-
bility, com a axiomtica que tem sido usada at hoje.
...hoje...
Atualmente, idias recentes em Teoria da Probabilidade so (i) Probabilidade Interva-
lar, (ii) Probabilidades Imprecisas e (iii) Probabilidade sobre Domnios.
Que ferramentas usar, e como, analisar, entender, modelar as seguintes situaes:
(i) anlise de tempo de execuo de um algoritmo:
pior caso (worst-case);
caso mdio (average-case).
(ii) alocamento dinmico de memria;
(iii) anlise do erro de arredondamento acumulado em um algoritmo numrico;
(iv) anlise de um sistema computacional servindo a um grande nmero de usurios.
Campos & Rgo
1.3. EXPERIMENTO ALEATRIO 10
1.3 Experimento Aleatrio
Um experimento qualquer processo de observao. Em muitos experimentos de interesse,
existe um elemento de incerteza, ou chance, que no importa o quanto se saiba sobre o pas-
sado de outras performances deste experimento, no possvel predizer o seu comportamento
em futuras realizaes por vrias razes: impossibilidade de saber todas as causas envolvidas;
dados insucientes sobre as suas condies iniciais; os fenmenos que o geraram podem ser
to complexos que impossibilitam o clculo do seu efeito combinado; ou, na verdade, existe
alguma aleatoriedade fundamental no experimento. Tais experimentos so conhecidos como
experimentos aleatrios. Salvo mencionado em contrrio, este livro restringe-se classe de
experimentos aleatrios cujo conjuntos de possveis resultados seja conhecido
2
.
Os resultados de um experimento aleatrio so caracterizados pelos seguintes componen-
tes:
(i) o conjunto de resultados possveis: ;
(ii) a coleo de conjuntos de resultados de interesse: A;
(iii) um valor numrico, p, da probabilidade de ocorrncia de cada um dos conjuntos de
resultados de interesse.
1.4 Espao Amostral
O conjunto de possveis resultados de um experimento aleatrio chamado de espao amos-
tral. Em um dado experimento aleatrio a especicao do espao amostral deve ser tal que
este (i) liste todos os possveis resultados do experimento sem duplicao e o (ii) faa em
um nvel de detalhamento suciente para os interesses desejados, omitindo resultados que,
embora logicamente ou sicamente possveis, no tenham qualquer implicao prtica na
sua anlise.
Por exemplo, uma nica jogada de uma moeda pode ter o espao amostral tradicional
= {cara, coroa}, ou poderia se considerar que a moeda pode, sicamente, car equilibrada
na borda = {cara, coroa, borda}. Uma outra possibilidade seria levar em considerao as
coordenadas (x, y) do centro da moeda quando ela para aps ser jogada no ar. Portanto,
muito mais se poderia dizer sobre o resultado de uma jogada de uma moeda que os simples
resultados binrios tradicionais cara e coroa. Informaes outras so ignoradas quando se
usa uma hiptese adicional, no mencionada, que existe uma aposta com pagamentos que
dependem apenas de qual lado da moeda cai para cima.
2
importante ressaltar que freqentemente so encontradas situaes prticas onde no se consegue
descrever todos os possveis resultados de um experimento. Uma maneira de contornar este problema
assumir que um resultado possvel do experimento a no ocorrncia de qualquer dos resultados descritos,
contudo, em problemas prticos, tal suposio pode acarretar em diculdades quando se tenta elicitar ou
deduzir probabilidades.
Campos & Rgo
1.5. EVENTOS E COLEO DE EVENTOS 11
1.5 Eventos e Coleo de Eventos
Um evento um subconjunto do espao amostral, ou seja, um conjunto de resultados
possveis do experimento aleatrio. Ao se realizar um experimento aleatrio, se o resultado
pertence a um dado evento A, diz-se que A ocorreu.
Denio 1.5.1: Os eventos A e B so disjuntos ou mutuamente excludentes ou mutua-
mente exclusivos se no puderem ocorrer juntos, ou, em liguagem de conjuntos, A B = .
A ocorrncia de eventos combinados tambm um evento; essas combinaes podem ser
expressas atravs das operaes de conjuntos: complementar, unio, interseco e diferena.
Exemplo 1.5.2: Sejam A, B, e C eventos em um mesmo espao amostral . Expresse os
seguintes eventos em funo de A, B, e C e operaes Booleanas de conjuntos.
(a) Pelo menos um deles ocorre:
A B C.
(b) Exatamente um deles ocorre:
(A B
c
C
c
) (A
c
B C
c
) (A
c
B
c
C).
(c) Apenas A ocorre:
(A B
c
C
c
).
(d) Pelo menos dois ocorrem:
(A B C
c
) (A B
c
C) (A
c
B C) (A B C).
(e) No mximo dois deles ocorrem:
(A B C)
c
.
(f) Nenhum deles ocorre:
(A
c
B
c
C
c
).
(g) Ambos A e B ocorrem, mas C no ocorre:
(A B C
c
).
Embora possa-se pensar que, dado um espao amostral, necessariamente de interesse
analisar todos os seus subconjuntos (e isto eventualmente verdadeiro), tem-se trs razes
para esperar que o interesse seja apenas por alguns de seus subconjuntos. Primeiro, o espao
amostral pode conter um grau de detalhamento superior ao de interesse no problema. Por
exemplo, ele pode representar uma nica jogada de um dado mas o interesse apenas em
saber se o resultado par ou mpar. Segundo, o objetivo associar a cada evento A com
uma probabilidade P(A); como essas probabilidades esto baseadas em algum conhecimento
sobre a tendncia de ocorrer o evento, ou no grau de crena que determinado evento ocorrer,
Campos & Rgo
1.6. FUNDAMENTOS DE PROBABILIDADE 12
o conhecimento sobre P pode no se estender para todos os subconjuntos de . A terceira
(e tcnica) razo para limitar a coleo de eventos de interesse que condies impostas em
P pelos axiomas de Kolmogorov, que sero vistos adiante, podem no permitir que P seja
denida em todos os subconjuntos de , em particular isto pode ocorrer quando for no
enumervel (fato este fora do escopo deste livro).
Em probabilidade, o interesse em uma coleo especial A de subconjuntos do espao
amostral (A um conjunto cujos elementos tambm so conjuntos!) que so eventos de
interesse no que se refere ao experimento aleatrio E e os quais tem-se conhecimento sobre
a sua probabilidade. A chamado de uma -lgebra de eventos. O domnio de uma medida
de probabilidade uma -lgebra.
Denio 1.5.3: Uma lgebra de eventos F uma coleo de subconjuntos do espao
amostral que satisfaz:
(i) F no vazia;
(ii) F fechada com respeito a complementos (se A F, ento A
c
F);
(iii) F fechada com respeito a unies nitas (se A, B F, ento A B F).
Denio 1.5.4: Uma -lgebra A uma lgebra de eventos que tambm fechada com
relao a uma unio enumervel de eventos,
(i I)A
i
A
iI
A
i
A.
Pelas Leis de De Morgan, tem-se que A tambm fechada com respeito a interseces
enumerveis.
Exemplo 1.5.5:
(a) A menor -lgebra de eventos A = {, };
(b) A maior -lgebra de eventos o conjunto das partes de ;
(c) Um outro exemplo:
= {1, 2, 3}, A = {, , {2}, {1, 3}}.
1.6 Fundamentos de Probabilidade
Raciocnio probabilstico aparece em uma ampla variedade de fenmenos de chance e incer-
teza. Julgamentos probabilsticos so expressos tanto atravs da linguagem quanto atravs
de aes. Ultrapassar um carro em uma estrada com um outro vindo em direo oposta
implica em calcular distncias, velocidades e riscos de coliso; considerando que um julga-
mento errneo pode ter graves consequncias, espera-se que esse erro seja sucientemente
pequeno. Em geral, preciso incorporar, a vrios fenmenos do dia-a-dia, o conhecimento
probabilstico que seja tanto qualitativo e expresso linguisticamente quanto quantitativo e
expresso numericamente.
De acordo com Fine (2005), o raciocnio probabilstico pode ser classicado nas seguintes
dimenses:
Campos & Rgo
1.6. FUNDAMENTOS DE PROBABILIDADE 13
grau de preciso o conceito estrutural;
o signicado, ou interpretao a ser dada probabilidade;
estrutura matemtica formal da funo probabilidade dada por um conjunto de axio-
mas.
O conceito estrutural determina a preciso esperada de que probabilidade represente
fenmenos aleatrios. A interpretao proporciona a base com a qual a probabilidade deve
ser determinada e indica o que se pode aprender com ela, ou seja, o que uma armao
probabilstica signica. O conceito estrutural e a interpretao guiam a escolha dos axiomas.
O conjunto de axiomas, contudo, pode somente capturar uma parte do que se entende da
interpretao.
A compreenso de fundamentos de probabilidade importante, pois aplicaes de teoria
da probabilidade dependem fortemente de seus fundamentos. Por exemplo, os fundamentos
inuem na escolha dos mtodos estatsticos a serem utilizados (frequentistas e Bayesianos,
entre outros) e na interpretao dos resultados obtidos. Os prximos exemplos motivam a
importncia do estudo de fundamentos de probabilidade.
Exemplo 1.6.1: Suponha que Alice tenha uma moeda honesta e que ela e Joo saibam que
a moeda honesta. Alice joga a moeda e olha o resultado. Aps a moeda ser jogada, qual
a probabilidade de cara segundo Joo? Um argumento diria que a probabilidade ainda
1/2, pois Joo nada aprendeu sobre o resultado da jogada, ento ele no deve alterar o valor
de sua probabilidade. Um outro argumento, questiona se realmente faz sentido falar sobre
probabilidade de cara depois que a moeda foi jogada. Segundo este argumento, a moeda ou
caiu cara ou coroa, ento o melhor que Joo pode armar que a probabilidade de cara ou
0 ou 1, mas ele no sabe discernir entre esses valores.
Exemplo 1.6.2: Suponha agora que Alice tenha duas moedas, uma honesta e outra ten-
denciosa e duas vezes mais provvel dar cara que coroa com esta moeda. Alice escolhe uma
das moedas (suponha que ela sabe distinguir as moedas) e est prestes a jog-la. Joo sabe
que uma moeda honesta e que a outra tendenciosa e que duas vezes mais provvel cair
cara que coroa com a moeda tendenciosa, mas ele no sabe qual moeda Alice escolheu nem
lhe foi dada a probabilidade com que Alice escolhe a moeda honesta. Qual a probabilidade
de cara segundo Joo?
Exemplo 1.6.3: Paradoxo de Ellsbergue. Suponha que existam duas urnas cada uma
com 60 bolas. A urna 1 contm 30 bolas azuis e 30 bolas verdes. Tudo que se sabe sobre
a urna 2 que ela contm bolas azuis e verdes, mas no se sabe a distribuio das bolas.
Considere que existem duas loteria com prmios baseados no sorteio de bolas dessas urnas.
Loteria L
1
paga R$1.000,00 se uma bola azul for sorteada na urna 1, e R$0,00 caso contrrio.
Loteria L
2
paga R$1.000,00 se uma bola azul for sorteada na urna 2, e R$0,00 caso contrrio.
A maioria das pessoas quando questionada se prefere um bilhete da Loteria L
1
ou L
2
prefere
um bilhete da loteria L
1
. Suponha agora que temos duas outras loterias L
3
e L
4
, onde a
primeira paga R$1.000,00 somente se uma bola verde for sorteada da urna 1, e a segunda
Campos & Rgo
1.6. FUNDAMENTOS DE PROBABILIDADE 14
para R$1.000,00 somente se uma bola verde for sorteada da urna 2. Tambm, vericado que
a maioria das pessoas que preferiram a loteria L
1
loteria L
2
preferem a loteria L
3
loteria
L
4
. Com estas preferncias, no possvel que o decisor possua uma nica distribuio de
probabilidade subjetiva sobre as cores das bolas na urna 2, pois a primeira preferncia (L
1
sobre L
2
) indica que o decisor considera que existam mais bolas verdes que azuis na urna 2,
e a segunda (L
3
sobre L
4
) indica que o decisor considera que existam mais bolas azuis que
verdes na urna 2. Esse fenmeno conhecido na literatura como averso a ambiguidade,
e pode-se modelar a incerteza do decisor por um conjunto de medidas de probabilidade ao
invs de uma nica medida de probabilidade.
1.6.1 Hierarquia de Conceitos Estruturais de Probabilidade
A seguir apresenta-se uma variedade de conceitos estruturais e interpretaes de probabili-
dade que foram descritos em Fine (2005).
Possivelmente. Possivelmente A o conceito mais rudimentar e menos preciso, e o usado
pelos antigos Gregos para distinguir entre o que era necessrio e o que era contingente.
Existe um nmero de conceitos de possibilidade que incluem os seguintes:
possibilidade lgica, no sentido que no se contradiz logicamente;
possibilidade epistmica, segundo a qual a ocorrncia de A no contradiz o conhe-
cimento, que inclui, mas estende mais que mera lgica;
possibilidade fsica, a ocorrncia de A compatvel com leis fsicas, contudo pode
ser extremamente improvvel por exemplo, uma moeda parando e cando
equilibrada na borda em uma superfcie rgida;
possibilidade prtica, a noo do dia-a-dia segundo a qual A praticamente possvel
se ele tem pelo menos uma verossimilhana no to pequena de ocorrer.
Provavelmente. Provavelmente A um fortalecimento da noo de possibilidade signi-
cando mais que provvel que no provvel. Enquanto ela pode corresponder ao caso
que a probabilidade numrica de A seja maior que 1/2, este conceito no requer qual-
quer comprometimento com uma probabilidade numrica nem com o preciso estado de
conhecimento que uma probabilidade numrica requer.
Probabilidade Comparativa. A pelo menos to provvel quanto B. A probabilidade
comparativa inclui provavelmente A atravs de A pelo menos to provvel quanto
A
c
. Pode ser relacionada com probabilidade numrica atravs de P(A) P(B); em-
bora como nos dois exemplos anteriores, probabilidade comparativa no requer qual-
quer comprometimento com probabilidade numrica.
Probabilidade Intervalar. A tem probabilidade intervalar, ou probabilidade inferior e
superior (P(A), P(A)). Isto permite um grau de indeterminao varivel sem o com-
prometimento de que exista um verdadeiro valor no intervalo; alm dessa proba-
bilidade intervalar, existe outra (Campos, 1997), baseada na matemtica intervalar
(Moore, 1966 e 1979) e na aritmtica de exatido mxima (Kulisch & Miranker, 1981),
Campos & Rgo
1.6. FUNDAMENTOS DE PROBABILIDADE 15
a qual consiste de um intervalo fechado de nmeros reais, [P(A), P(A)] com a preciso
(Sterbenz, 1974) to pequena quanto possvel.
Probabilidade Numrica. A probabilidade de A o nmero real P(A). Este o con-
ceito usual e ser o enfocado neste livro. Enquanto este conceito absorveu quase toda a
ateno de pessoas envolvidas com fenmenos de chance e incerteza e provou ser frut-
fero na prtica cientca, este no o nico conceito utilizado em linguagem ordinria
e no raciocnio probabilstico do dia-a-dia. duvidoso que uma dada probabilidade
numrica seja adequada a todas as aplicaes em que utilizada, e provvel que tenha
inibido o desenvolvimento de teorias matemticas apropriadas para outros fenmenos
aleatrios.
De agora em diante o foco o conceito estrutural mais utilizado que a probabilidade
numrica.
1.6.2 Interpretaes de Probabilidade
Parece no ser possvel reduzir probabilidade a outros conceitos; ela uma noo em si
mesma. O que pode ser feito relacionar probabilidade a outros conceitos atravs de uma
interpretao. Os cinco mais comuns grupos de interpretao para probabilidade so os
seguintes:
1. Lgica: grau de conrmao da hiptese de uma proposio que A ocorre dada uma
evidncia atravs da proposio que B ocorreu. Esta interpretao est ligada a um
sistema lgico formal e no ao mundo fsico. Ela usada para tornar o raciocnio indu-
tivo quantitativo. Quando s evidncias, ou premissas, so insucientes para deduzir
logicamente a hiptese ou concluso, pode-se ainda medir quantitativamente o grau
de suporte que uma evidncia d a uma hiptese atravs de probabilidade lgica. Por
exemplo, um jurado tem de utilizar julgamento que envolvem probabilidades lgicas
para condenar ou no um determinado ru baseado nas evidncias disponveis.
2. Subjetiva: se refere ao grau de crena pessoal na ocorrncia do evento A e medida
atravs da interpretao comportamental de disposio a apostar ou agir. Por exemplo,
se um torcedor de futebol acredita que seu time tem mais de 50% de chance de ganhar
o campeonato, ele dever preferir um bilhete de loteria que lhe pague um prmio L se
seu time for campeo a um outro bilhete que lhe pague um prmio L obteno de
cara no lanamento de uma moeda honesta.
3. Frequentista: se refere ao limite da freqncia relativa de ocorrncia do evento A em
repetidas realizaes no relacionadas do experimento aleatrio E. Note que limites de
freqncia relativas so uma idealizao, pois no se pode realizar innitas realizaes
de um experimento.
4. Propensidade: tendncia, propensidade, ou disposio para um evento A ocorrer. Por
exemplo, consideraes de simetria, podem levar a concluso que um dado tem a mesma
propenso, ou tendncia, a cair em qualquer uma de suas faces.
Campos & Rgo
1.7. FREQUNCIA RELATIVA 16
5. Clssica: baseada em uma enumerao de casos igualmente provveis.
Na maior parte do restante deste livro adota-se a abordagem tradicional de interpretao
de probabilidade, isto , a frequentista.
1.7 Frequncia Relativa
A seguir ser ser discutido o terceiro elemento para modelagem do raciocnio probabilstico,
isto , a associao de uma medida numrica a eventos a qual representa a probabilidade
com que eles ocorrem. As propriedades desta associao so motivadas, em grande parte,
pelas propriedades da frequncia relativa. Considere uma coleo de experimentos aleatrios
E
i
que possuem a mesma -lgebra de eventos A e tm resultados individuais no necessa-
riamente numricos {
i
}. Fixando uma dada sequncia de resultados {
i
}, se o interesse
na ocorrncia de um dado evento A, a frequncia relativa de A nada mas que uma mdia
aritmtica da funo indicadora de A calculada em cada um dos termos da sequncia {
i
},
ou seja,
Denio 1.7.1: A frequncia relativa de um evento A, f
n
(A), determinada pelos resul-
tados {
1
, . . . ,
n
} de n experimentos aleatrios,
f
n
(A) =
1
n
n

i=1
I
A
(
i
) =
N
n
(A)
n
.
Propriedades da frequncia relativa so:
(i) f
n
(A) : A IR.
(ii) f
n
(A) 0.
(iii) f
n
() = 1.
(iv) Se A e B so disjuntos, ento f
n
(A B) = f
n
(A) + f
n
(B).
(v) Se A
1
, A
2
, A
n
, uma seqncia de eventos disjuntos dois a dois, ento f
n
(

i=1
A
i
) =

i=1
f
n
(A
i
).
No que se segue, supe-se que existe alguma base emprica, fsica ou sobrenatural, que
garanta que f
n
(A) P(A), embora que o sentido de convergncia quando n cresce s
ser explicado pela Lei dos Grandes Nmeros (estudada posteriormente). Esta tendncia da
frequncia relativa de estabilizar em um certo valor conhecida como regularidade estatstica.
Deste modo, P herdar propriedades da frequncia relativa f
n
.
Campos & Rgo
1.8. AXIOMAS DE KOLMOGOROV 17
1.8 Axiomas de Kolmogorov
Antes de um sistema computacional ou algoritmo ser analisado, vrias distribuies de pro-
babilidade tm de ser analisadas. De onde vm essas distribuies? Como possvel avaliar
a vazo (throughput), tempo de resposta (response time), conabilidade (reliability) e dis-
ponibilidade (availability) de um sistema de comunicao? Estas e outras perguntas esto
ligadas a problemas de avaliao de desempenho, a qual suportada, primordialmente, por
Probabilidade, Estatstica e Processos Estocsticos.
Questes de probabilidade em situaes prticas basicamente constituem-se, como seria
o esperado, em como calcular probabilidades. A onde a situao se complica. Se o
espao amostral nito, pode-se usar a denio clssica e a complicao consiste em
contar, o que implica no uso de tcnicas de anlise combinatria, que, no so fceis. Se o
problema envolve volumes de slidos, possvel, em algumas situaes, usar as chamadas
probabilidades geomtricas e o problema est resolvido. Se o espao amostral enumervel,
conhecimentos sobre progresses geomtricas adquiridos no segundo grau resolvem alguns
problemas. Uma outra forma para calcular probabilidades usar a frequncia relativa como
sendo a probabilidade para um dado evento. Nesse caso teramos que ter um grande nmero
de observaes, mas, o que grande? Portanto a construo axiomtica da teoria da
probabilidade, abstrai o clculo de probabilidades de casos particulares e nos prov de um
mtodo formal para resolver problemas probabilsticos.
Os axiomas descritos a seguir no descrevem um nico modelo probabilstico, apenas de-
terminam uma famlia de modelos probabilsticos, com os quais podem-se utilizar mtodos
matemticos para encontrar propriedades que sero verdadeiras em qualquer modelo proba-
bilstico. A escolha de um modelo especco satisfazendo os axiomas feita pelo probabilista,
ou estatstico, familiar com o fenmeno aleatrio sendo modelado.
As propriedades de frequncia relativa motivam os primeiros quatro axiomas de Kolmo-
gorov:
(K1) Inicial. O experimento aleatrio descrito pelo espao de probabilidade (, A, P)
que consiste do espao amostral , de uma -lgebra A, construda a partir de e de
uma funo de valores reais P : A IR.
(K2) No-negatividade. A A, P(A) 0.
(K3) Normalizao Unitria. P() = 1.
(K4) Aditividade Finita. Se A, B so disjuntos, ento P(A B) = P(A) + P(B).
fcil provar (tente!) utilizando induo matemtica que (K4) vlida para qualquer
coleo nita de eventos disjuntos dois a dois, ou seja, se A
i
A
j
= , i = j, com i, j =
1 n, ento P(
n
i=1
A
i
) =

n
i=1
P(A
i
).
Um quinto axioma, embora no tenha signicado em espaos amostrais nitos, foi pro-
posto por Kolmogorov para garantir continuidade da medida de probabilidade.
Campos & Rgo
1.8. AXIOMAS DE KOLMOGOROV 18
(K5) Continuidade Monotnica. Se para todo i > 0, A
i+1
A
i
e
i
A
i
= , ento
lim
i
P(A
i
) = 0.
3
Um forma equivalente de (K5) a seguinte, que, conforme visto anteriormente, tambm
uma propriedade da frequncia relativa:
(K5)

-aditividade. Se {A
i
} uma coleo enumervel de eventos disjuntos dois a dois,
ento
P(

i=1
A
i
) =

i=1
P(A
i
).
Teorema 1.8.1: Se P satisfaz (K1)(K4), ento P satisfaz (K5)

se, e somente se, satisfaz


(K5).
Prova: Primeiro, ser provado que (K1)(K5) implicam o axioma da -aditividade (K5)

.
Seja {A
i
} qualquer seqncia enumervel de eventos disjuntos dois a dois, e dena para todo
n
B
n
=
i>n
A
i
,

i=1
A
i
= B
n
(
n
i=1
A
i
).
Claramente, para todo i n, tem-se que A
i
e B
n
so disjuntos. Por (K4), tem-se
P(

i=1
A
i
) = P(B
n
) +
n

i=1
P(A
i
).
Por denio de srie numrica,
lim
n
n

i=1
P(A
i
) =

i=1
P(A
i
).
(K5)

segue-se se se mostrar que lim


n
P(B
n
) = 0. Note que B
n+1
B
n
, e que

n=1
B
n
= .
Ento por (K5), o limite acima zero e K4

verdadeiro.
Agora, ser provado que (K1)(K4), (K5)

implicam o axioma da continuidade monot-


nica (K5). Seja {B
n
} qualquer coleo enumervel de eventos satisfazendo as hipteses do
axioma (K5): B
n+1
B
n
e

n=1
B
n
= . Denindo, A
n
= B
n
B
n+1
observa-se que {A
n
}
uma coleo enumervel de eventos disjuntos dois a dois e que
B
n
=
jn
A
j
.
3
(K5) (ou equivalentemente (K5)

uma idealizao que no aceita por alguns tratamentos subjetivistas


de probabilidade, em especial no aceita por uma escola de estatsticos liderados por deFinetti (1972).
Assumir apenas aditividade nita, embora parea mais plausvel, pode levar a complicaes inesperadas em
teoria estatstica. Portanto, neste livro, prossegue-se sob a suposio que o axioma da continuidade (K5)
vlido.
Campos & Rgo
1.8. AXIOMAS DE KOLMOGOROV 19
Ento, por (K5)

,
P(B
n
) = P(
jn
A
j
) =

jn
P(A
j
).
Como por (K5)

j=1
P(A
j
) = P(

j=1
A
j
) 1,
ento
lim
n
P(B
n
) = lim
n

jn
P(A
j
) = 0,
logo (K5) verdadeiro.
Denio 1.8.2: Uma funo que satisfaz (K1)(K5) chamada de uma medida de
probabilidade.
A terna (, A, P) chamada de espao de probabilidade. Intuitivamente quando se
modela uma problema atravs de probabilidade, basicamente, o que se faz especicar cada
uma das componentes da terna acima.
Eventos so os elementos de A, aos quais se pode atribuir probabilidade. Probabilidade
uma funo cujo argumento um conjunto. Portanto, no somente conjuntos, como tambm
as operaes sobre eles, tm uma importncia fundamental em teoria da probabilidade.
Entretanto, preciso que a linguagem de conjuntos seja traduzida para a linguagem de
probabilidade. A Tabela 4, a seguir, exibe algumas dessas tradues. A idia subjacente
que um experimento aleatrio foi realizado e aconteceu algum evento.
Tabela 4. Interpretaes interessantes
conjunto universo espao amostral, evento certo
elemento evento elementar
A conjunto A evento A
conjunto vazio evento impossvel
A
c
ou A complemento de A no ocorreu o evento A
A B A interseco B os eventos A e B ocorreram
A B A unio B os eventos A ou B ocorreram

n
A
n
interseco dos conjuntos A
n
todos os eventos A
n
ocorreram

n
A
n
unio dos conjuntos A
n
ao menos um dos eventos A
n
ocorreu
1.8.1 Exemplos de Medidas de Probabilidade
Probabilidade clssica
P(A) =
n
A
n
,
onde n o nmero de resultados possveis (nmero de elementos do espao amostral) e n
A
o nmero de resultados favorveis a A (nmero de elementos de A) dentre o nmero de
resultados possveis. Baseia-se na idia de resultados igualmente provveis. Neste caso,
Campos & Rgo
1.8. AXIOMAS DE KOLMOGOROV 20
P(A) =
||A||
||||
(1.1)
denido para qualquer subconjunto A de . O fato que 0 ||A|| |||| e que
||A B|| = ||A|| +||B|| ||A B||,
permitem vericar que P satisfaz os axiomas de Kolmogorov.
A denio pode ser aplicada apenas a uma classe limitada de problemas, isto , aqueles
onde possvel contar os elementos do espao amostral, , e do evento A. Nessa contagem
a tcnica usada Anlise Combinatria, que ser estudada com mais detalhes no prximo
captulo.
O exemplo a seguir calcula probabilidades usando (1.1). Adicionalmente, a expresso (1.2)
mostra que, neste caso, existe uma frmula fechada,
log
b
(1 + 1/k),
para o clculo
lim
N
N(k)/N.
Exemplo 1.8.3: Todo nmero real x unicamente representado na expanso b-dica
(Kulisch & Miranker, 1981)
x = d
n
d
n1
. . . d
1
d
0
.d
1
d
2
. . . =

i=n
d
i
b
i
,
onde {+, } o sinal do nmero, b a base da representao, b IN, b > 1, d
i
,
i = n, . . . , , so inteiros positivos tais que 0 d
i
b 1 e d
i
b 2 para innitamente
muitos i.
Sejam a, b, k, n, N inteiros positivos tais que a, b, N 2, k = 1, , b 1, n = 1, , N.
Seja N(k) o nmero de vezes que k aparece como o primeiro dgito de {a
n
}
N
n=1
na base b.
Sabe-se que
lim
N
N(k)/N = log
b
(1 + 1/k). (1.2)
As Tabelas 1 e 2 abaixo apresentam resultados computacionais para k, N(k) e
P(k, N) = N(k)/N,
que a frequncia relativa, onde b = 10, N = 10
2
, 10
3
, 10
4
, 10
5
a = 2, 3.
Campos & Rgo
1.8. AXIOMAS DE KOLMOGOROV 21
Tabela 1: k, N(k) e P(k, N) para 2
n
, n = 1, , N e N = 10
2
, 10
3
, 10
4
, 10
5
k N(k) P(k, 10
2
) N(k) P(k, 10
3
) N(k) P(k, 10
4
) N(k) P(k, 10
5
)
1 30 0.30 301 0.301 3010 0.3010 30103 0.30103
2 17 0.17 176 0.176 1761 0.1761 17611 0.17611
3 13 0.13 125 0.125 1249 0.1249 12492 0.12492
4 10 0.10 97 0.097 970 0.0970 9692 0.09692
5 7 0.07 79 0.079 791 0.0791 7919 0.07919
6 7 0.07 69 0.069 670 0.0670 6695 0.06695
7 6 0.06 56 0.056 579 0.0579 5797 0.05797
8 5 0.05 52 0.052 512 0.0512 5116 0.05116
9 6 0.05 45 0.045 458 0.0458 4576 0.04576
Tabela 2: k, N(k) e P(k, N) para 3
n
, n = 1, , N e N = 10
2
, 10
3
, 10
4
, 10
5
k N(k) P(k, 10
2
) N(k) P(k, 10
3
) N(k) P(k, 10
4
) N(k) P(k, 10
5
)
1 28 0.28 300 0.300 3007 0.3007 30101 0.30101
2 19 0.19 177 0.177 1764 0.1764 17611 0.17611
3 12 0.12 123 0.123 1247 0.1247 12492 0.12492
4 8 0.08 98 0.098 968 0.0968 9693 0.09693
5 9 0.09 79 0.079 792 0.0792 7916 0.07916
6 7 0.07 66 0.066 669 0.0669 6697 0.06697
7 7 0.07 59 0.059 582 0.0582 5798 0.05798
8 5 0.05 52 0.052 513 0.0513 5116 0.05116
9 5 0.05 46 0.046 458 0.0458 4576 0.04576
A Tabela 3 exibe valores numricos aproximados para o resultado terico
log
b
(1 + 1/k),
quando a = 2 e N = 10
5
.
Campos & Rgo
1.8. AXIOMAS DE KOLMOGOROV 22
Tabela 3: Valores para log
b
(1 + 1/k)
k log
10
(1 + 1/k)
1 0.30103
2 0.17609
3 0.12385
4 0.09691
5 0.07918
6 0.06818
7 0.05690
8 0.05115
9 0.04532
Probabilidade frequentista
P(A) = lim
n
n
A
n
,
onde n
A
o nmero de ocorrncias de A em n ensaios independentes do experimento (teoria
baseada na observao).
O problema quando da aplicao desta denio para calcular a probabilidade de um
evento : quando que n sucientemente grande, isto , quando que o experimento
aleatrio foi realizado um nmero sucientemente grande de vezes, para garantir que a
freqncia relativa do evento A P(A)? A resposta formal a esta pergunta ser respondida
no estudo de teoremas limite.
Probabilidade geomtrica. Considerando o espao amostral constitudo de objetos ge-
omtricos tais como pontos, retas e planos, a obteno de probabilidades, nesse caso,
referenciada na literatura como problemas de probabilidade geomtrica. Portanto, dado um
certo evento A, nesse contexto, de modo geral,
P(A) =
m(A)
m()
,
desde que todas as medidas estejam bem denidas.
Por exemplo, suponha que um ponto seja escolhido aleatoriamente no quadrado 0 x
1, 0 y 1. Pode-se encontrar a probabilidade de que o ponto pertena regio limitada
pelas retas x 1/2 e x+y 1/3, atravs da razo entre a rea desta regio, que 1/2, pela
rea do quadrado 0 x 1, 0 y 1, que 1. Logo a probabilidade igual a 1/2.
Espao amostral enumervel. O nmero de elementos de nito, mas os eventos
elementares no so necessariamente equiprovveis. Seja = {
1
,
2
, . . . ,
n
} um conjunto
nito, e seja P({
i
}) = p
i
, onde p
i
0, i = 1, n e

n
i=1
p
i
= 1, e P(A) =

i
A
P({
i
}).
Neste caso, tambm fcil vericar que P uma medida de probabilidade.
Campos & Rgo
1.8. AXIOMAS DE KOLMOGOROV 23
1.8.2 Propriedades de uma Medida de Probabilidade
Teorema 1.8.4: Se P uma medida de probabilidade, ento
(i) P(A
c
) = 1 P(A).
(ii) P() = 0.
(iii) P(A) 1.
(iv) Monotonicidade. Se A B, ento P(A) P(B).
(v) A
1
A
2
P(A
2
A
1
) = P(A
2
) P(A
1
).
(vi) P(A B) = P(A) + P(B) P(A B).
(vii) P(A B) max{P(A), P(B)} min{P(A), P(B)} P(A B).
(viii) Sejam A
1
A
2
. . ., tal que lim
n
(A
n
) =

n=1
A
n
= A, ento lim
n
P(A
n
) =
P(A). (continuidade da probabilidade)
(ix) Sejam A
1
A
2
. . ., tal que lim
n
(A
n
) =

n=1
A
n
= A, ento lim
n
P(A
n
) =
P(A). (continuidade da probabilidade)
Prova:
(i) Segue-se do fato que = A A
c
, (K3), e (K4), pois
1 = P() = P(A) + P(A
c
).
(ii)
c
= , e por (K3) e (K4),
P() = 1 P() = 0.
(iii) 1 = P() = P(A) + P(A
c
) P(A), desde que P(A
c
) 0 por (K2).
(iv) B = A (B A), onde A e B A so disjuntos. Ento (K4) implica que P(B) =
P(A) + P(B A). O resultado segue do fato que P(B A) 0.
(v)
A
1
A
2
A
2
= A
1
(A
2
A
c
1
) P(A
2
) = P(A
1
) + P(A
2
A
c
1
).
Como A
2
A
c
1
= A
2
A
1
, o resultado segue-se.
(vi) A B = A (B A), e A e B A so disjuntos, (K4) implica que P(A B) =
P(A) + P(B A); como B = (A B) (B A), onde A B e B A so disjuntos,
(K4) implica que P(B) = P(A B) + P(B A). Logo,
P(A B) = P(A) + P(B) P(A B).
Campos & Rgo
1.8. AXIOMAS DE KOLMOGOROV 24
(vii) Sem perda de generalidade, sejam
P(A) = min{P(A), P(B)}
e
P(B) = max{P(A), P(B)}.
Como B A B P(B) P(A B)
P(A B) max{P(A), P(B)}.
Obviamente,
max{P(A), P(B)} min{P(A), P(B)}.
De A B A, tem-se que P(A B) P(A). Logo,
min{P(A), P(B)} P(A B).
(viii) Construindo uma sequncia, {B
n
}, de elementos excludentes:
B
1
= A
1
B
2
= A
2
A
c
1

B
n
= A
n
A
c
n1

Tem-se que:

n=1
A
n
= A =

n=1
B
n
e
A
n
=
n
k=1
B
k
.
Logo,
lim
n
P(A
n
) = lim
n
P(
n
k=1
B
k
)
= P(

n=1
B
n
)
= P(

n=1
A
n
)
= P(A)
= P( lim
n
A
n
).
Campos & Rgo
1.8. AXIOMAS DE KOLMOGOROV 25
(ix) Como A
n
A
n+1
, n 1, ento A
c
n
A
c
n+1
. Do item anterior tem-se que
lim
n
P(A
c
n
) = P(

A
c
n
) = P(A
c
).
Logo,
lim
n
P(A
n
) = lim
n
(1 P(A
c
n
))
= 1 lim
n
P(A
c
n
)
= 1 P(

A
c
n
)
= 1 P(A
c
)
= P(A)
= P( lim
n
A
n
).
As propriedades (viii) e (ix) armam que para sequncias monotnicas o limite comuta
com a probabilidade, pois em ambos os casos tem-se que:
lim
n
P(A
n
) = P( lim
n
A
n
).
A notao usada neste captulo a comumente encontrada nos livros de probabilidade.
Entretanto, fora do contexto de probabilidade, possvel, alis quase certo, encontrar notao
distinta. Por exemplo, em Russel & Norvig (1995) tem-se P(A B), P(A B) e P(A)
para P(A B), P(A B), P(A
c
).
Teorema 1.8.5: Probabilidade de Parties. Se {A
i
} uma partio enumervel (ou
nita) de composta de conjuntos em A, ento para todo B A
P(B) =

i
P(B A
i
).
Prova: Como {A
i
} uma partio, segue-se que
B = B = B (
i
A
i
) =
i
(B A
i
).
O resultado segue vem por (K5)

.
Teorema 1.8.6: Desigualdade de Boole. Para n eventos arbitrrios {A
1
, . . . , A
n
}, a
desigualdade de Boole
P(
n
i=1
A
i
)
n

i=1
P(A
i
).
Campos & Rgo
1.8. AXIOMAS DE KOLMOGOROV 26
Prova: Seja n = 2. Logo, P(A
1
A
2
) = P(A
1
) + P(A
2
) P(A
1
A
2
) P(A
1
) + P(A
2
)
porque P(A
1
A
2
) 0. Usar induo para provar para n.
Corolrio 1.8.7: Para n eventos arbitrrios {A
1
, . . . , A
n
},
P(A
i
)
n

i=1
P(A
i
) (n 1).
Prova: Utilizando a Lei de De Morgan e a desigualdade de Boole para os eventos {A
c
1
, . . . , A
c
n
},
P(
n
i=1
A
c
i
) = 1 P(
n
i=1
A
i
)
n

i=1
P(A
c
i
) =
n

i=1
(1 P(A
i
)).
Logo,
P(
i=1
nA
i
)
n

i=1
P(A
i
) (n 1).
O prximo teorema permite calcular de maneira exata a probabilidade P(
n
i=1
A
i
) para
n eventos arbitrrios.
Teorema 1.8.8: Princpio da Incluso-Excluso. Seja I um conjunto genrico de ndi-
ces subconjunto no-vazio qualquer de {1, 2, . . . , n}. Para eventos arbitrrios {A
1
, . . . , A
n
},
P(
n
i=1
A
i
) =

=I{1,...,n}
(1)
||I||+1
P(
iI
A
i
),
onde o somatrio sobre todos os 2
n
1 conjuntos de ndices excluindo apenas o conjunto
vazio.
No caso particular de n = 3, o princpio de incluso-excluso arma quea
P(A
1
A
2
A
3
) = P(A
1
) + P(A
2
) + P(A
3
)
P(A
1
A
2
) P(A
1
A
3
) P(A
2
A
3
)
P(A
1
A
2
A
3
)
Exemplo 1.8.9: Em um grupo de r pessoas qual a probabilidade de haver pelo menos
duas pessoas que completem aniversrio no mesmo dia, assumindo que a distribuio de
aniversrios uniforme ao longo do ano e desprezando a existncia de anos bissextos?
Soluo: Para determinar esta probabilidade a probabilidade usada a clssica. O nmero
de resultados possveis para os aniversrios de r pessoas 365
r
. O nmero de casos possveis
onde todas as pessoas fazem aniversrio em dias diferentes dado por 365 364
(365 (r 1)). Portanto, o nmero de casos possveis onde pelo menos duas pessoas fazem
Campos & Rgo
1.8. AXIOMAS DE KOLMOGOROV 27
aniversrio no mesmo dia a diferena entre o nmero total de aniversrios possveis e o
nmero de casos onde as pessoas tm aniversrios em datas diferentes, ou seja, igual a
365
r
365 364 (365 (r 1)).
Logo, a probabilidade deste evento :
1
365 364 (365 (r 1))
365
r
.
Para r = 23, essa probabilidade aproximadamente igual a 0.51. E para r = 50, 0.97.
Exemplo 1.8.10: Em uma loteria de N nmeros h um s prmio. Salvador compra n
(1 < n < N) bilhetes para uma s extrao e Slvio compra n bilhetes, um para cada uma
de n extraes. Qual dos dois jogadores tm mais chance de ganhar algum prmio?
Soluo: A probabilidade de Salvador ganhar algum prmio
n
N
. O nmero total de n
extraes possveis N
n
. O nmero de casos onde Slvio no ganha qualquer prmio
(N 1)
n
, logo, o nmero de casos onde Slvio ganha algum prmio igual a N
n
(N 1)
n
.
Portanto, a probabilidade de Slvio ganhar algum prmio 1
(N1)
n
N
n
.
Por induo prova-se que Salvador tem mais chance de ganhar, ou seja,
n
N
> 1
(N1)
n
N
n
,
que equivale a
(N 1)
n
N
n
> 1
n
N
.
Para n = 2:
(N 1)
2
N
2
= 1
2
N
+
1
N
2
> 1
2
N
.
Suponha que para n = k,
(N 1)
k
N
k
> 1
k
N
.
Multiplicando esta expresso por
N1
N
,
(N 1)
k+1
N
k+1
> (
N 1
N
)(1
k
N
) = 1
1
N

k
N
+
k
N
2
> 1
k + 1
N
.
Exemplo 1.8.11: Doze pessoas so divididas em trs grupos de 4. Qual a probabilidade
de duas determinadas dessas pessoas carem no mesmo grupo?
Soluo: O nmero total de divises de doze pessoas em 3 grupos de 4
_
12
4
__
8
4
__
4
4
_
. Para
contar o nmero de casos favorveis ao evento, sabe-se que existem 3 opes de escolha sobre
em qual grupo as duas pessoas determinadas podem car. Das 10 pessoas restantes, tem de
se escolher mais duas para estarem neste grupo, o que pode ser resolvido de
_
10
2
_
maneiras
diferentes. E
_
8
4
__
4
4
_
so maneiras diferentes de dividir as outras 8 pessoas nos dois grupos
restantes. Portanto, a probabilidade de duas determinadas pessoas carem no mesmo grupo
:
3
_
10
2
__
8
4
__
4
4
_
_
12
4
__
8
4
__
4
4
_ =
3
11
.
Campos & Rgo
1.8. AXIOMAS DE KOLMOGOROV 28
Exemplo 1.8.12: Suponha que numa sala esto n mes cada uma com um lho. Suponha
que duplas sejam formadas aleatoriamente, onde cada dupla contm uma me e um lho.
Qual a probabilidade de que pelo menos uma me forme uma dupla com seu prprio lho?
Soluo: Seja A
i
o evento que a i-sima me forma dupla com seu lho. O objetivo
determinar
P(
n
i=1
A
i
).
Calculando esta probabilidade utilizando a frmula da incluso-excluso. Note que:
P(A
i
) =
(n 1)!
n!
=
1
n
para todo i {1, 2, . . . , n}
P(A
i
A
j
) =
(n 2)!
n!
=
1
n(n 1)
para i = j
e em geral, para um grupo I {1, 2, . . . , n} de mes,
P(
iI
A
i
) =
(n ||I||)!
n!
.
Como existem
_
n
||I||
_
grupos de mes com cardinalidade ||I||,
P(
n
i=1
A
i
) =
n

i=1
(1)
i+1
_
n
i
_
(n i)!
n!
=
n

i=1
(1)
i+1
1
i!
Note que quando n , esta probabilidade tende a 1
1
e
.
Exemplo 1.8.13: Demonstre que se P(A
i
) = 1 para i = 1, 2, . . ., ento P(

i=1
A
i
) = 1.
Soluo: Como P(A
i
) = 1, tem-se que P(A
c
i
) = 1 P(A
i
) = 0. Logo, pela desigualdade
de Boole, P(

i=1
A
c
i
)

i=1
P(A
c
i
) = 0. Portanto, P(

i=1
A
c
i
) = 0 e pela Lei de DeMorgan,

i=1
A
i
= (

i=1
A
c
i
)
c
, tem-se que P(

i=1
A
i
) = 1 P(

i=1
A
c
i
) = 1.
Exemplo 1.8.14: Demonstre: se A
1
, A
2
, . . . e B
1
, B
2
, . . . so eventos do mesmo espao de
probabilidade tais que P(A
n
) 1 e P(B
n
) p, ento P(A
n
B
n
) p.
Soluo: Note que
P(A
n
B
n
) = 1 P((A
n
B
n
)
c
) = 1 P(A
c
n
B
c
n
)
1 P(A
c
n
) P(B
c
n
) = P(A
n
) + P(B
n
) 1. (1.1)
Como P(A
n
) + P(B
n
) 1 p, tem-se que liminf P(A
n
B
n
) p. Por outro lado, como
P(A
n
B
n
) P(B
n
) e P(B
n
) p, tem-se que limsup P(A
n
B
n
) p. Portanto, limP(A
n

B
n
) = p.
Campos & Rgo
1.9. APRENDENDO UM POUCO MAIS 29
1.9 Aprendendo um pouco mais
Se o espao amostral for nito, toda lgebra uma -lgebra, pois s existe um nmero
nito de eventos distintos. Se o espao amostral for innito, existem lgebras que no so
-lgebras, como mostra o exemplo seguinte.
Exemplo 1.9.1: Um conjunto co-nito se seu complementar for nito. A coleo de
conjuntos de nmeros reais nitos e co-nitos uma lgebra que no uma -lgebra.
Lema 1.9.2: Se A uma -lgebra, ento A
Prova: Como A no vazio, seja A um seu elemento qualquer. Pela segunda propriedade
de lgebras, tem-se que A
c
A, e pela terceira, = A A
c
A.
Teorema 1.9.3: Sejam A
1
e A
2
lgebras (-lgebras) de subconjuntos de e seja A =
A
1
A
2
a coleo de subconjuntos comuns s duas lgebras. Ento, A ma lgebra (-
lgebra).
Prova: Como A
1
e A
2
so lgebras, ambos contm . Ento, A. Se A A, ento A
est em ambos A
1
e A
2
. Logo, A
c
est em ambos A
1
e A
2
, e portanto na sua interseco A.
Se A, B A, ento eles esto em ambos A
1
e A
2
. Consequentemente, AB est em ambos
A
1
e A
2
e, portanto, em A. Como A satisfaz as trs condies da denio de lgebra de
eventos, A uma lgebra de eventos. A prova no caso de -lgebras anloga.
Corolrio 1.9.4: Existe uma menor (no sentido de incluso) lgebra (-lgebra) contendo
qualquer famlia dada de subconjuntos de .
Prova: Seja C uma coleo qualquer de subconjuntos de . Dena A(C) como sendo o
conjunto que igual a interseco de todas as lgebras de eventos que contm C, isto :
A(C) =

AC:A uma lgebra de eventos


A.
Pelo Teorema 1.9.3, A(C) uma lgebra de eventos, e consequentemente a menor lgebra
de eventos contendo C. A prova no caso de -lgebras anloga.
Deste modo, pode-se denir a seguinte -lgebra de subconjuntos dos reais.
Exemplo 1.9.5: A -lgebra de Borel B de subconjuntos reais , por denio, a menor
-lgebra contendo todos os intervalos e a -lgebra usual quando se lida com quantidades
reais ou vetoriais. Em particular, tem-se que unies enumerveis de intervalos (por exemplo,
o conjunto dos nmeros racionais), seus complementos (por exemplo, o conjunto dos nmeros
irracionais), e muito mais esto em B. Para todos os ns prticos, pode-se considerar que B
contm todos os subconjuntos de reais que consegue-se descrever.
Campos & Rgo
1.10. EXERCCIOS 30
1.10 Exerccios
1. (a) Uma caixa com 6 chips contm 2 defeituosos. Descreva um espao amostral para
cada uma das situaes abaixo:
(a) Os chips so examinados um a um at que um defeituosos seja encontrado.
(b) Os chips so examinados um a um at que todos os defeituosos sejam encon-
trados.
(b) Generalize o problema. Responda s mesmas questes anteriores, supondo que se
tem N chips na caixa, dos quais n < N so defeituosos.
2. Coloque V ou F nas sentenas abaixo:
(a) A = P(A) = 0. ( )
(b) P(A) = 0 A = . ( )
(c) A = P(A) = 0. ( )
(d) A B P(A) P(B). ( )
(e) A B P(A) P(B). ( )
(f) A B P(A) P(B). ( )
(g) A e B excludentes P(A B) = P(A) + P(B). ( )
(g) A e B excludentes P(A B) = P(A)P(B). ( )
3. Professor Lenidas est tentando calcular a probabilidade p = P(A) do evento A, e
determinou que ela uma raiz do seguinte polinmio de grau cinco:
(p 3)(p 3

1)(p + 3

1)(p + 0.3)(p 0.3) = 0.


Baseado nesta fato, qual o valor de p?
4. Se = {a, b, c}, a lgebra A o conjunto das partes de e a medida de probabilidade
P parcialmente denida por
P({a, b}) = 0.5, P({b, c}) = 0.8, P({a, c}) = 0.7,
ento complete a especicao de P para todos os eventos em A.
5. Se {A
i
} for uma partio enumervel de e P(A
i
) = ab
i
, i 1, quais as condies
que a e b devem satisfazer para que P seja uma medida de probabilidade?
6. As seguintes questes no esto relacionadas umas com as outras.
(a) Se I
A
I
B
for identicamente igual a zero, o que dizer a respeito da relao entre A
e B?
(b) Se A B
c
= B A
c
, o que dizer a respeito da relao entre A e B?
(c) Se I
2
A
+ I
2
B
for identicamente igual a 1, o que concluir sobre A e B?
Campos & Rgo
1.10. EXERCCIOS 31
7. Determine se cada uma das armaes a seguir so verdadeiras ou falsas. Se a relao
for falsa, apresente um contra-exemplo. Se for verdadeira, prove-a.
(a) Se x A e A B, ento x B.
(b) Se A B e B C, ento A C.
(c) Se A B e B C, ento A C.
(d) Se A B e B C, ento A C.
(e) Se x A e A B, ento x / B.
(f) Se A B e x / B, ento x / A.
8. Descreva um espao amostral para cada um dos experimentos abaixo.
(a) Strings de dgitos binrios so geradas at que pela primeira vez o mesmo resultado
aparea duas vezes em sucesso.
(b) Strings de dgitos binrios so geradas at que o dgito 1 aparea pela primeira
vez.
(c) Strings de 3 dgitos binrios so geradas. Observe as sequncias de zeros e uns.
(d) Conte o nmero de zeros em uma string de dgitos binrios com n dgitos.
9. Mostre que P(E F) P(E) P(E F) P(E) + P(F).
10. Um ponto escolhido ao acaso sobre um quadrado unitrio. Determine a probabilidade
de que o ponto esteja no tringulo limitado por x = 0, y = 0 e x + y = 1.
11. Um ponto escolhido ao acaso sobre um disco unitrio. Determine a probabilidade de
que o ponto esteja no setor angular de 0 a /4.
12. Suponha que A, B e C sejam eventos tais que P(A) = P(B) = P(C) = 1/4, P(AB) =
P(B C) = 0 e P(A C) = 1/8. Calcule a probabilidade de que ao menos um dos
eventos A, B ou C ocorra.
13. Suponha a declarao, if B then s
1
else s
2
, onde B um evento aleatrio, e suponha
que um experimento aleatrio consiste em observar duas execues desta declarao.
Sejam os eventos
E
1
= {pelo menos uma execuo de s
1
}
e
E
2
= {a declarao s
2
executada pela primeira vez}.
(a) Exiba um espao amostral para o experimento.
(b) Calcule P(E
1
) e P(E
2
), em termos de P(B).
14. Distribuio de Nmeros Primos
Campos & Rgo
1.10. EXERCCIOS 32
(a) Considere os intervalos A
k
= [10k, 10(k + 1)), k = 0 , 9. Sejam, n o total dos
primos em [0,100) e n
k
a freqncia deles em cada A
k
. Seja p
k
=
n
k
n
. Calcule p
k
e faa um grco com os pontos (k, p
k
), para k = 0 , 9.
(b) Repita todo o problema anterior com A
k
= [100k, 100(k + 1)), k = 0 , 9, e n o
total dos primos em [0,1000).
(c) Agora com A
k
= [1000k, 1000(k +1)), k = 0 , 9, sendo n o total dos primos em
[0,10000).
(d) Os resultados que voce obteve, empiricamente, aceitam ou refutam a seguinte
armao: nmeros primos ocorrem menos frequentemente entre inteiros maiores
que entre inteiros menores.
(e) Seja (x) o nmero de primos menores que x IR, x > 0. De acordo com seus
clculos, qual armao abaixo voc aceita como sendo verdadeira?
(x) log
2
(log
2
x) + 1,
(x) log
2
(log
2
(x) + 1,
onde em (a) x = 100, em (b) x = 1000 e em (c) x = 10000.
15. Sejam A
1
, A
2
, , B
1
, B
2
, eventos aleatrios denidos no mesmo espao de proba-
bilidade (, A, P). Mostre que:
(a) P(
n
k=1
A
k
) 1

n
k=1
P(A
c
k
).
(b) Se P(A
k
) 1 para k = 1, , n, ento P(
n
k=1
A
k
) 1 n.
(c) Se P(A
n
) = 0 para n = 1, 2, ento P(

n=1
A
n
) = 0.
16. Para todo conjunto unidimensional A para o qual a integral existe seja P(A) =
_
A
f(x)dx, onde f(x) = 6x(1 x), 0 < x < 1 e zero para x (0, 1). Se A
1
=
{x |
1
4
< x <
3
4
} e A
2
= {x | x =
1
2
}, calcule P(A
1
), P(A
2
), P(A
1
A
2
), P(A
1
A
2
).
17. Seja a probabilidade do evento A,
P(A) =
_
A
e
x
dx, 0 < x < ,
e seja A
k
= {x | 2 1/k < x 3}, k = 1, 2, . Mostre que lim
k
P(A
k
) =
P(lim
k
A
k
). Seja agora A
k
= {x | 1/k 2 < x 3}, k = 1, 2, . Mostre que
lim
k
P(A
k
) = P(lim
k
A
k
).
18. Um poliedro com k faces, k > 3, rotuladas f
1
, f
2
, , f
k
atirado aleatoriamente em
um plano, sendo observada a face tangente ao mesmo.
(a) Descreva o espao amostral.
(b) Seja o evento A, a face voltada para baixo no excede o nmero k/2. Descreva A.
(c) Calcule P(A) para um (c1) icosaedro, (c2) dodecaedro e (c3) octaedro.
Campos & Rgo
1.10. EXERCCIOS 33
19. Uma coleo de 100 programas foi checada com respeito a erros de sintaxe, S, erros
de entrada e sada, I, e outros tipos de erros, E. Os resultados obtidos foram: 20, S;
10, I; 5, E; 6, S I; 3, S E; 2, I E; 1, S I E. Um programa selecionado
aleatoriamente. Calcule a probabilidade de que este apresente
(a) S ou I;
(b) ao menos um tipo de erro.
20. Dois dados so lanados. Considere os eventos
A = {a soma dos pontos sobre as duas faces um nmero par},
B = {1 aparece pelo menos sobre um dos dados}.
Descreva os eventos: (a) A B; (b) A B; (c) A B.
21. Um alvo consiste de dez crculos concntricos com raios r
k
, k = 1, 2, . . . 10, onde r
1
<
r
2
< . . . r
10
. O evento A
k
indica um acerto no crculo de raio k. Descreva em palavras
os eventos B =
6
k=1
A
k
e C =
10
k=5
A
k
.
22. Um experimento consiste em se retirar 3 impressoras de um lote e test-las de acordo
com alguma caracterstica de interesse. Assinale D, para impressora defeituosa e B,
para perfeita. Sejam os eventos:
A
1
= {a 1a. impressora foi defeituosa},
A
2
= {a 2a. impressora foi defeituosa},
A
3
= {a 3a. impressora foi defeituosa}.
(a) Descreva o espao amostral.
(b) Liste todos os elementos de cada um dos seguintes eventos: A
1
, A
2
, A
1
A
2
,
A
2
A
3
, A
1
A
2
A
3
, A
1
A
2
A
3
.
(c) Explique, em palavras, o signicado dos eventos acima.
23. Seja A o evento pelo menos um entre trs itens checados defeituoso, e B o evento
todos os trs itens so bons. Descreva os eventos: (a) AB; (b) AB; (c) A; (d) B.
24. H trs edies diferentes cada uma contendo pelo menos trs volumes. Os eventos A,
B e C, respectivamente indicam que pelo menos um livro escolhido da primeira, da
segunda e da terceira edio. Sejam
A
s
= {s volumes so escolhidos da primeira edio},
B
k
= {k volumes so escolhidos da segunda edio}.
Qual o signicado dos eventos: (a) ABC; (b) ABC; (c) AB
3
; (d) A
2
B
2
;
(e) (A
1
B
3
) (A
3
B
1
)?
Campos & Rgo
1.10. EXERCCIOS 34
25. Um nmero escolhido do conjunto dos nmeros naturais. Sejam
A = {o nmero escolhido divisvel por 5} e B = {o nmero escolhido termina por 0}.
Qual o signicado dos eventos A B e A B?
26. Sejam A, B e C eventos e A B. Determine: (a) A B; (b) A B; (c) A B C;
(d) A B C.
27. Mostre que os seguintes eventos formam uma partio do espao amostral : A, AB
e A B.
28. Encontre uma condio sob a qual os eventos AB, AB e AB sejam mutuamente
exclusivos.
29. Suponha que uma instruo leva pelo menos 9 segundos para ser transmitida, proces-
sada e a resposta exibida no terminal. O experimento aleatrio consiste em mensurar
o tempo decorrido da operao completa. Descreva o espao amostral.
30. Uma moeda honesta lanada at que aparea o mesmo resultados duas vezes seguidas.
(a) Descreva o espao amostral.
(b) Encontre a probabilidade de que o experimento termine antes de 6 lanamentos.
(c) Encontre a probabilidade de que seja necessrio um nmero par de lanamentos
para que o experimento termine.
Campos & Rgo
Captulo 2
Espaos Amostrais Finitos
2.1 Introduo
No captulo anterior foi visto que se = {
1
,
2
, . . . ,
n
} um conjunto nito, ento para
determinar a probabilidade de qualquer evento A suciente especicar a probabilidade de
cada evento simples ou elementar {
i
}, ou seja P({
i
}) = p
i
. fcil ver que os axiomas de
Kolmogorov implicam que p
i
0, i 1 e

n
i=1
p
i
= 1, e P(A) =

i
A
P({
i
}).
Para se determinar as probabilidades dos eventos simples hipteses adicionais so neces-
srias. Por exemplo, se em = {w
1
, w
2
, w
3
}, {w
1
} for 3 vezes mais provvel que {w
2
, w
3
},
e {w
2
} for igualmente provvel a {w
3
}, tem-se que p
1
= 3(p
2
+ p
3
), p
2
= p
3
. Logo, como
p
1
+ p
2
+ p
3
= 1 ento p
3
= p
2
=
1
8
, e p
1
=
3
4
.
De acordo com a denio clssica de probabilidade onde o espao amostral nito e
os possveis resultados do experimento so equiprovveis, a probabilidade de qualquer evento
A A proporcional a sua cardinalidade, isto ,
P(A) =
||A||
||||
.
Portanto, fundamental contar a quantidade de elementos do evento de interesse quanto
do espao amostral.
Neste captulo sero estudados mtodos de contagem, tambm conhecidos como mtodos
de anlise combinatria. Embora conjuntos com poucos elementos possam ser contados
exaustivamente (fora-bruta), conjuntos com tamanho moderado podem ser difceis de contar
sem a utilizao dessas tcnicas matemticas.
2.2 Regra da Adio
Suponha que um procedimento, designado por 1, possa ser realizado de n
1
maneiras. Admita-
se que um segundo procedimento, designado por 2, possa ser realizado de n
2
maneiras. Alm
disso, suponha que no seja possvel que ambos os procedimentos 1 e 2 sejam realizados em
conjunto. Ento, o nmero de maneiras pelas quais pode-se realizar ou 1 ou 2 n
1
+ n
2
.
35
2.3. REGRA DA MULTIPLICAO 36
Esta regra tambm pode ser estendida da seguinte maneira: se existirem k procedimentos
e o i-simo procedimento puder ser realizado de n
i
maneiras, i = 1, 2, . . . , k, ento, o nmero
de maneiras pelas quais pode-se realizar ou o procedimento 1, ou o procedimento 2, . . ., ou o
procedimento k, dado por n
1
+n
2
+. . . +n
k
, supondo que dois quaisquer deles no possam
ser realizados conjuntamente.
Exemplo 2.2.1: Seja o problema de escolher um caminho entre duas cidades A e B
dentre trs percurssos pelo interior e dois pelo litoral. Portanto existem 3 + 2 = 5 caminhos
disponveis para a viagem.
2.3 Regra da Multiplicao
Suponha que um procedimento designado por 1 possa ser executado de n
1
maneiras. Admita-
se que um segundo procedimento, designado por 2, possa ser executado de n
2
maneiras.
Suponha tambm que cada maneira de executar 1 possa ser seguida por qualquer maneira
para executar 2. Ento, o procedimento formado por 1 seguido de 2 poder ser executado
de n
1
n
2
maneiras.
Obviamente esta regra pode ser estendida a qualquer nmero nito de procedimentos. Se
existirem k procedimentos e o i-simo procedimento puder ser executado de n
i
maneiras, i =
1, 2, . . . , k, ento o procedimento formado por 1, seguido por 2,. . . , seguido pelo procedimento
k, poder ser executado de n
1
n
2
n
k
maneiras.
Exemplo 2.3.1: Quantos divisores inteiros e positivos possui o nmero 360? Quantos
desses divisores so pares? Quantos so mpares? Quantos so quadrados perfeitos?
Soluo: 360 = 2
3
3
2
5. Os divisores inteiros e positivos de 360 so os nmeros da forma
2
a
3
b
5
c
, onde a {0, 1, 2, 3}, b {0, 1, 2}, e c {0, 1}. Portanto, existem 4 3 2 = 24
maneiras de escolher os expoentes a, b, c. Logo h 24 divisores.
Para o divisor ser par, a no pode ser zero. Ento, existem 332 = 18 divisores pares.
Por outro lado, para o divisor ser mpar, a tem que ser zero. Logo, existem 1 3 2 = 6
divisores mpares. Por m para o divisor ser quadrado perfeito os expoentes tm que ser
pares. Logo, existem 2 2 1 = 4 divisores quadrados perfeitos.
Exemplo 2.3.2: De quantos modos o nmero 720 pode ser decomposto em um produto
de dois inteiros positivos? E o nmero 144?
Soluo: 720 = 2
4
3
2
5. Os divisores inteiros e positivos de 720 so os nmeros da
forma: 2
a
3
b
5
c
, onde a {0, 1, 2, 3, 4}, b {0, 1, 2}, e c {0, 1}. Portanto, existem
5 3 2 = 30 maneiras de escolher os expoentes a, b, c. Logo h 30 divisores. Observe que
como 720 no um quadrado perfeito, para cada divisor x de 720 existe um outro divisor
y = x de 720 tal que x y = 720. Portanto, cada produto contm dois divisores diferentes
de 720. Como existem 30 divisores, existem 15 produtos diferentes.
144 = 2
4
3
2
. Seguindo o raciocnio anterior, tem-se 5 3 = 15 divisores de 144. Note
que 144 = 12
2
e este constitui um produto de inteiros positivos que igual a 144. Os demais
produtos contm dois inteiros positivos diferentes que so divisores de 144. Como existem
14 divisores de 144 diferentes de 12, ento existem 7 produtos envolvendo estes divisores.
Logo, tem-se um total de 8 produtos diferentes.
Campos & Rgo
2.4. AMOSTRAGEM OU ESCOLHAS COM OU SEM REPOSIO 37
Exemplo 2.3.3: O conjunto A possui 4 elementos e, o conjunto B, 7. Quantas funes
f : A B existem? Quantas delas so injetoras?
Soluo: Para cada elemento de A tem-se 7 possveis valores diferentes. Como A contm 4
elementos, existem 7 7 7 7 = 7
4
funes diferentes. Recorde que uma funo injetora
se f(a) = f(b) sempre que a = b. Portanto, o mesmo elemento de B no pode ser imagem
de dois elementos de A, logo existem 7 6 5 4 = 840 funes injetoras.
Exemplo 2.3.4: Em uma banca h 5 exemplares iguais da Veja, 6 exemplares iguais da
poca e 4 exemplares iguais da Isto . Quantas colees no-vazias de revistas dessa banca
podem ser formadas?
Soluo: Note que cada coleo de revistas vai ser composta por a revistas Veja, b revistas
poca e c revistas Isto , onde 0 a 5, 0 b 6, 0 c 4, e pelo menos 1 de a, b,
ou c diferente de zero. Ento, tem-se 6 7 5 1 = 210 1 = 209 diferentes colees
no-vazias dessas revistas.
2.4 Amostragem ou Escolhas com ou sem Reposio
Dado um conjunto com n elementos distintos, o nmero,
n,r
, de maneiras de selecionar
uma sequncia distinta de comprimento r escolhida desse conjunto com repetidas selees
do mesmo elemento sendo permitidas, amostragem com reposio, dada por n
r
, uma
vez que o mesmo procedimento repetido r vezes e cada procedimento tem n maneiras de
ser executado.
Exemplo 2.4.1: Nmero de Sequncias Binrias ou Subconjuntos. O nmero
de sequncias binrias de comprimento r igual a 2
r
pois neste caso tem-se que para cada
posio i da sequncia, n
i
= 2. O nmero de subconjuntos de um dado conjunto A, ||A|| = r,
pode ser determinado enumerando A = {a
1
, a
2
, a
3
, . . . , a
r
} e descrevendo cada subconjunto
B de A por uma sequncia binria
(b
1
, b
2
, . . . , b
r
),
onde b
i
= 1 se a
i
B e b
i
= 0, caso contrrio. Como existem 2
r
destas sequncias, ento
existem 2
r
subconjuntos de um conjunto de r elementos. Portanto, se ||A|| = r, o conjunto
das partes de A, possui 2
r
elementos, o que explica a notao exponencial do conjunto das
partes.
Dado um conjunto com n elementos distintos, o nmero (n)
r
de maneiras de selecionar
uma sequncia distinta de comprimento r escolhida desse conjunto com repetidas selees
do mesmo elemento no sendo permitidas, amostragem sem reposio, dada por
A
r
n
= (n)
r
= n(n 1) (n r + 1) =
r1

i=0
(n i),
desde que no primeiro procedimento (escolha do primeiro elemento da sequncia) tem-se n
maneiras de execut-lo, no segundo procedimento (escolha do segundo elemento da sequn-
cia) tem-se n 1 maneiras de execut-lo, . . ., e no r-simo e ltimo procedimento (escolha
Campos & Rgo
2.5. PERMUTAES E ARRANJOS 38
do r-simo elemento da sequncia) tem-se nr +1 maneiras de execut-lo. Este nmero de
sequncias tambm chamado na literatura de arranjo quando tem-se n elementos distintos
e deseja-se escolher r deles onde a ordem de escolha importante.
2.5 Permutaes e Arranjos
Um caso particular de amostragem sem reposio quando o objetivo saber o nmero de
permutaes de um conjunto de n elementos distintos. Neste caso, r = n, e o nmero de
permutaes dado por
n! = (n)
n
= n(n 1) 1,
onde n! conhecida como funo fatorial.
Propriedades da funo fatorial incluem:
0! = 1! = 1
e
n! = n(n 1)!.
Exemplo 2.5.1: Se A um conjunto de n elementos, quantas so as funes f : A A
bijetoras?
Soluo: Tem-se que garantir que cada elemento de A tem uma imagem diferente. Como A
nito e tem n elementos, f tambm sobrejetora e, portanto, bijetora. Ento, o primeiro
elemento de A tem n opes, o segundo n 1 opes, at que o ltimo elemento de A tem
somente uma opo disponvel. Portanto, existem n! funes bijetoras f : A A.
Exemplo 2.5.2: De quantos modos possvel colocar r rapazes e m moas em la de
modo que as moas permaneam juntas?
Soluo: Primeiro tem-se r + 1 opes de se escolher o lugar das moas. Em seguida, r!
maneiras de se escolher a posio dos rapazes entre si, e m! maneiras de se escolher a posio
das moas entre si. Portanto, tem-se (r + 1)r!m! modos diferentes de escolha.
Exemplo 2.5.3: Quantas so as permutaes simples dos nmeros 1, 2, . . . , 10 nas quais
o elemento que ocupa o lugar de ordem k, da esquerda para a direita, sempre maior que
k 3?
Soluo: Inicialmente escolhem-se os nmeros da direita para esquerda. Observe que o
nmero no lugar de ordem 10, tem que ser maior que 7, portanto existem 3 opes. O
nmero no lugar de ordem 9, tem que ser maior que 6, existem, portanto, 3 opes visto
que um dos nameros maiores que 6 j foi utilizado na ltima posio. De maneira similar
pode-se ver que existem 3 opes para os nmeros que ocupam do terceiro ao oitavo lugar.
O nmero no lugar de ordem 2, tem somente 2 opes, pois oito nmeros j foram escolhidos
anteriormente. Finalmente, resta apenas um nmero para o lugar de ordem n. Portanto,
existem 2 3
8
permutaes deste tipo.
Exemplo 2.5.4: Com oito bandeiras diferentes, quantos sinais feitos com trs bandeiras
diferentes se podem obter?
Soluo: Neste caso a ordem acarreta diferena e por isso tem-se (8)
3
= 336 sinais.
Campos & Rgo
2.6. COMBINAES 39
2.6 Combinaes
O nmero de conjuntos, ou colees no ordenadas, de tamanho r escolhidas de um conjunto
universo de tamanho n, onde, como apropriado para conjuntos, no permitida a duplicao
de elementos, dado pelo coeciente binomial:
_
n
r
_
=
(n)
r
r!
=
A
r
n
r!
=
n!
(n r)!r!
.
Para vericar isto, note que o nmero de colees ordenadas de tamanho r sem repetio
(n)
r
. Como os elementos de cada sequncia de comprimento r so distintos, o nmero de
permutaes de cada seqncia r!. Porm, utilizando a regra da multiplicao, o proce-
dimento de se escolher uma coleo ordenada de r termos sem repetio igual a primeiro
escolher uma coleo no-ordenada de r termos sem repetio e depois escolher uma ordem
para esta coleo no-ordenada, ou seja,
A
r
n
= (n)
r
=
_
n
r
_
r!,
de onde segue o resultado.
O coeciente binomial tem as seguintes propriedades:
_
n
r
_
=
_
n
n r
_
,
_
n
0
_
= 1,
_
n
1
_
= n,
_
n
r
_
= 0, se n < r.
O coeciente binomial tambm d o nmero de subconjuntos de tamanho r que podem
ser formados de um conjunto de n elementos. Como visto que o nmero total de subconjuntos
de um conjunto de tamanho n 2
n
, ento
2
n
=
n

r=0
_
n
r
_
.
Os nmeros
_
n
r
_
so chamados de coecientes binomiais porque eles aparecem como
coecientes na expresso binomial (a + b)
n
. Se n for um inteiro positivo, (a + b)
n
=
(a + b)(a + b) (a + b). Quando a multiplicao tiver sido realizada, cada termo ser
formado de k elementos de a e de (n k) elementos de b, para k = 0, 1, 2, . . . , n. Mas,
quantos termos da forma a
k
b
nk
existiro? Simplesmente contado o nmero de maneiras
possveis de escolher k dentre os n elementos a, deixando de lado a ordem (onde o i-simo
Campos & Rgo
2.6. COMBINAES 40
elemento a corresponde ao i-simo fator do produto acima). Mas isso justamente dado por
_
n
k
_
. Da obtm-se o que conhecido como o Teorema Binomial:
(a + b)
n
=
n

k=0
_
n
k
_
a
k
b
nk
.
Exemplo 2.6.1: Dentre oito pessoas, quantas comisses de trs membros podem ser
escolhidas, desde que duas comisses sejam a mesma comisso se forem constitudas pelas
mesmas pessoas (no se levando em conta a ordem em que sejam escolhidas)?
Soluo: A resposta dada por
_
8
3
_
= 56 comisses possveis.
Exemplo 2.6.2: Um grupo de oito pessoas formado de cinco homens e trs mulhe-
res. Quantas comisses de trs pessoas podem ser constitudas, incluindo exatamente dois
homens?
Soluo: Aqui deve-se escolher dois homens (dentre cinco) e duas mulheres (dentre trs).
Portanto, o nmero procurado
_
5
2
__
3
1
_
= 30 comisses.
Exemplo 2.6.3: Quantas sequncias binrias de comprimento n contm no mximo trs
dgitos 1?
Soluo: Tem-se quatro casos possveis: todas as sequncias que no contm 1, todas as
que contm apenas um 1, todas as que contm dois dgitos 1 e todas as que contm trs
dgitos 1. Para 0 r n, existem exatamente
_
n
r
_
sequncias binrias com r nmeros 1.
Portanto, pela regra da adio existem
_
n
0
_
+
_
n
1
_
+
_
n
2
_
+
_
n
3
_
sequncias binrias de comprimento n contendo no mximo trs nmeros 1.
Exemplo 2.6.4: Quantas sequncias de cara e coroa de comprimento n contm pelo menos
1 cara?
Soluo: Neste caso, apenas uma sequncia no contm qualquer cara (a sequncia que
contm apenas coroa). Como o nmero total de sequncias de cara e coroa de comprimento
n igual a 2
n
, ento 2
n
1 sequncias de comprimento n contm pelo menos uma cara.
Exemplo 2.6.5: Determine o coeciente de x
3
no desenvolvimento de (x
4

1
x
)
7
.
Soluo: O termo genrico do desenvolvimento
_
7
k
_
(x
4
)
k
(
1
x
)
7k
= (1)
7k
_
7
k
_
x
5k7
.
Portanto, tem-se o termo x
3
se 5k 7 = 3, o que implica que k = 2. Logo, o coeciente de
x
3
(1)
5
_
7
2
_
= 21.
Campos & Rgo
2.7. APLICAES EM GRAFOS 41
2.7 Aplicaes em Grafos
Modelos matemticos de conectividade em sistemas de redes so baseados em grafos. Estes
modelos permitem que questes como a conectividade de todos os elementos de uma rede, a
robustez dessa conectividade a falhas em conexes entre pares de elementos e o comprimento
de caminhos entre pares de elementos sejam estudadas. A seguir, sero vistas determinadas
caractersticas de grafos luz das tcnicas de contagem.
2.7.1 Grafos No Direcionados
Denio 2.7.1: Um grafos no direcionado G = (V, E) denido por um conjunto V de
elementos chamados ns ou vrtices e um conjunto E {{u, v} : u, v V }} de pares no
ordenados de ns que so chamados de bordas ou arestas.
Um grafo no direcionado que contm n vrtices ser denotado por G
n
.
A aresta {u, v} vista como conectando os vrtices u e v os quais so chamados de
adjacentes. O caso especial da aresta {u, u} chamado de lao. Note que o grafo chamado
de no direcionado porque se u adjacente a v, ento v adjacente a u.
Nesse breve estudo de grafos, a no ser que seja mencionado o contrrio, os grafos no
tm laos.
Exemplo 2.7.2: Nmero de grafos no direcionados com n vrtices. Qual o nmero

n
de grafos no direcionados com um conjunto V de n vrtices? Qual o nmero
n,m
de
grafos no direcionados com um conjunto V de n de vrtices e um conjunto E de m arestas?
Soluo: Note que o nmero de arestas o nmero possvel de maneiras de escolher pares de
de vrtices de V (a ordem dos vrtices no relevante pois o grafo no direcionado). Ento,
tem-se
_
n
2
_
possveis arestas em um grafo. Cada grafo corresponde a um subconjunto do
conjunto de todas as arestas. Como existem 2
r
subconjuntos de um conjunto de r elementos,
ento existem

n
= 2
(
n
2
)
grafos no direcionados com n vrtices.
Como existem
_
n
2
_
possveis arestas, ento existem

n,m
=
__
n
2
_
m
_
grafos no direcionados com n vrtices e m arestas.
2.7.2 Grafos Direcionados
Enquanto algumas conexes so simtricas, outras no so. Por exemplo, seja a relao
social u pai de v, ou u orientador de v. Evidentemente essas relaes no so simtricas,
e para represent-las necessrio o conceito de grafos direcionados.
Campos & Rgo
2.8. CONTAGEM MULTINOMIAL OU PERMUTAO COM ELEMENTOS
REPETIDOS 42
Denio 2.7.3: Um grafo direcionado G = (V, E) um conjunto V de vrtices e um
conjunto E {(u, v) : u, v V } = V V de pares ordenados de vrtices que denem
arestas direcionadas que conectam u a v, mas no necessariamente o contrrio.
Exemplo 2.7.4: Quantos grafos direcionados sem laos existem com um conjunto V de
n vrtices? Qual o nmero de grafos direcionados com um conjunto V de n vrtices e um
conjunto E de m arestas?
Soluo. Como existem n(n1) pares ordenados de vrtices sem repetio, ento o nmero
total de possveis arestas do grafo n(n 1). Cada grafo corresponde a um subconjunto do
conjunto de todas as arestas. Ento, existem

n
= 2
n(n1)
grafos direcionados com n vrtices.
Como existem n(n 1) possveis arestas, ento existem
_
n(n 1)
m
_
grafos direcionados com n vrtices e m arestas.
2.8 Contagem Multinomial ou Permutao com Elemen-
tos Repetidos
Considere r tipos de elementos e n
i
cpias indistinguveis do elemento do tipo i. Por exemplo,
a palavra probabilidade tem duas cpias de cada uma das letras a,b,d,i e uma cpia de cada
uma das letras l,p,r,o,e. O nmero de sequncias ordenadas de comprimento n =

r
i=1
n
i

dado por
_
n
n
1
__
n n
1
n
2
__
n n
1
n
2
n
3
_
1 =
n!

r
i=1
n
i
!
.
Esta quantidade conhecida como coeciente multinomial e denotada por
_
n
n
1
n
2
. . . n
r
_
,
onde n =

r
i=1
n
i
.
Para vericar esta contagem, note que das n posies na sequncia de comprimento n,
pode-se escolher n
1
posies para os n
1
elementos indistinguveis do tipo 1 de
_
n
n
1
_
maneiras;
das n n
1
posies restantes na sequncia, n
2
posies para os n
2
elementos indistinguveis
do tipo 2 de
_
nn
1
n
2
_
maneiras. Finalmente, aps repetir este processo r 1 vezes, restam n
r
posies na sequncia para os n
r
elementos do tipo r, que s podem ser escolhidas de uma
nica maneira. Utilizando o mtodo da multiplicao, o nmero total de sequncias possveis
produto do nmero de maneiras onde os r tipos de elementos podem ser colocados.
Campos & Rgo
2.9. EXERCCIOS 43
O coeciente multinomial tambm calcula o nmero de parties de um conjunto n ele-
mentos em r subconjuntos com tamanhos dados n
1
, n
2
, . . . , n
r
. Aplicando-se o mesmo argu-
mento usado para demonstrar o Teorema Binomial, pode-se provar a seguinte generalizao
conhecida como Teorema Multinomial:
(x
1
+ x
2
+ . . . + x
r
)
n
=
n

i
1
=0
ni
1

i
2
=0

n
P
j<r1
i
j

i
r1
=0
_
n
i
1
i
2
. . . i
r
_
r

k=1
x
i
k
k
,
onde i
r
= n

j<r
i
j
.
Exemplo 2.8.1: Um monitor tendo resoluo de n = 1.280 854 pixels, com r = 3 cores
possveis (verde, azul, e vermelho) para cada pixel, pode mostrar
_
n
i
1
i
2
i
3
_
imagens tendo i
1
pixels verdes, i
2
pixels azuis, e i
3
pixels vermelhos. O nmero total de imagens que pode ser
exibida por este monitor para qualquer composio de cores de ver, azul, e vermelho pode
ser obtido utilizando o Teorema Multinomial fazendo x
1
= x
2
= . . . = x
r
= 1, dando o
resultado de r
n
possveis imagens.
Exemplo 2.8.2: Determine o coeciente de x
9
y
4
no desenvolvimento de (x
3
+ 2y
2
+
5
x
2
)
5
.
Soluo: O termo genrico do desenvolvimento
_
5
i
1
i
2
5 i
1
i
2
_
(x
3
)
i
1
(2y
2
)
i
2
(
5
x
2
)
5i
1
i
2
=
(2)
i
2
(5)
5i
1
i
2
_
5
i
1
i
2
5 i
1
i
2
_
x
3i
1
10+2i
1
+2i
2
y
2i
2
. (2.1)
Portanto, tem-se o termo x
9
y
4
se 5i
1
+2i
2
10 = 9 e 2i
2
= 4, o que implica que i
2
= 2 e
i
1
= 3. Logo, o coeciente de x
9
y
4
(2)
2
(5)
0
_
5
3 2 0
_
= 40.
2.9 Exerccios
1. Sabe-se que a senha pertencente a um sistema do Centro de Informtica-CIn/UFPE
possui 8 caracteres. Cada caracter pode ser qualquer letra (maisculas so diferentes de
minsculas), nmero ou caracter especial, somando ao todo 256 caracteres diferentes,
o que corresponde aos caracteres da tabela ASC. Com base nessas informaes calcule:
(a) Quantas senhas diferentes o sistema aceita?
(b) Quantas senhas diferentes podemos formar comeando com a letra a?
(c) Quantas senhas diferentes contendo o nmero 1 podemos formar?
(d) Quantas senhas diferentes podemos ter sem repetir nenhum caracter?
(e) Quantas senhas diferentes sem caracteres repetidos possuem a letra B ou possuem
o nmero 1 ou ambos?
(f) Desao: Quantas senhas diferentes possuem a letra Z vindo antes o caracter {?
Observao: vindo antes no signica imediatamente antes. (proposto por Gus-
tavo S. Ferreira)
Campos & Rgo
2.9. EXERCCIOS 44
2. O cdigo gentico especica um aminocido atravs de uma sequncia de trs nucleot-
deos. Cada nucleotdeo pode ser de um dos quatro tipos T, A, C e G, sendo permitidas
repeties. Quantos aminocidos podem ser codicados dessa maneira?
3. O cdigo Morse consiste de uma sequncia de pontos e traos em que repeties so
permitidas.
(a) Quantas letras se pode codicar usando exatamente n smbolos?
(b) Qual o nmero de letras que se pode codicar usando n ou menos smbolos?
4. Um domin um bloco retangular dividido em dois sub-retngulos. Cada sub-retngulo
possui um nmero. Sejam x e y esses nmeros (no necessariamente distintos). Como
o bloco simtrico, o domin (x, y) igual ao domin (y, x). Quantos blocos diferentes
de domin se pode fazer usando n nmeros diferentes?
5. Um homem possui n chaves das quais, exatamente uma abre a fechadura. Ele expe-
rimenta as chaves uma de cada vez, escolhendo ao acaso em cada tentativa uma das
chaves que no foi experimentada. Determine a probabilidade de que ele escolha a
chave correta na r-sima tentativa.
6. Uma caixa contm 40 fusveis bons e 10 defeituosos. Suponha que se selecionam 10
fusveis. Qual a probabilidade de que todos eles estejam bons?
7. Um nibus parte com 6 pessoas e para em 10 pontos diferentes. Supondo que os
passageiros tm igual probabilidade de descer em qualquer parada, determine a pro-
babilidade de que dois passageiros no desembarquem na mesma parada.
8. Uma caixa contm 10 bolas numeradas de 1 a 10. Seleciona-se uma amostra aleatria
de 3 elementos. Determine a probabilidade de que as bolas 1 e 6 estejam entre as bolas
selecionadas.
9. Uma caixa contm b bolas pretas e r bolas vermelhas. Bolas so extradas sem repo-
sio, uma de cada vez. Determine a probabilidade de se obter a primeira bola preta
na n-sima extrao.
10. Suponha que se extrai uma amostra de tamanho n de uma populao de r elemen-
tos. Determine a probabilidade de que nenhum de k elementos especcos estejam na
amostra se o mtodo utilizado
(a) amostragem sem reposio;
(b) amostragem com reposio.
11. Uma secretria descuidadamente coloca ao acaso n cartas em n envelopes. Determine
a probabilidade de que ao menos uma carta chegue ao seu destino.
12. Se voc possui 3 bilhetes de uma loteria para a qual se vendeu n bilhetes e existem 5
prmios, qual a probabilidade de voc ganhar pelo menos um prmio?
Campos & Rgo
2.9. EXERCCIOS 45
13. M mensagens so enviadas aleatoriamente atravs de N canais de comunicao, N >
M. Encontre a probabilidade do evento
A = {no mais que uma mensagem seja enviada atravs de cada canal}.
14. Qual a probabilidade de que os nascimentos de 12 pessoas caiam nos 12 diferentes
meses do ano (assumindo igual probabilidade para os nascimentos nos 12 meses)?
15. Dez livros so colocados aleatoriamente em uma prateleira. Encontre a probabilidade
de que:
(a) trs particulares livros estejam sempre juntos;
(b) k particulares livros estejam sempre juntos, 2 < k < 10.
16. Um conjunto de 4 chips de circuito integrado constitudo de 2 perfeitos e 2 defeituosos.
Se 3 chips so selecionados aleatoriamente do grupo, qual a probabilidade do evento
dois entre os 3 selecionados so defeituosos.
17. Calcule a probabilidade de que algum nmero decimal com k dgitos escolhido aleato-
riamente seja um nmero vlido de k dgitos na base octal.
18. Suponha o alfabeto com 26 letras. Calcule a probabilidade de que no haja letras
repetidas entre todas as seqncias com 3 letras.
19. Se uma caixa contm 75 chips de circuito integrado perfeitos e 25 defeituosos, e so
selecionados aleatoriamente 12, calcule a probabilidade de que pelo menos um dentre
os selecionados seja defeituoso.
20. Um professor faz 3 cartas de recomendao para 3 alunos. Entretanto, no momento de
entregar as cartas, ao invs de entregar cada carta ao seu respectivo dono, o professor
as entrega aleatoriamente.
(a) Qual a probabilidade de que ao menos um aluno tenha recebido a carta correta?
(b) Generalize o problema para n cartas.
21. Em um conjunto de 5 pessoas, compute a probabilidade de que pelos menos 2 faam
aniversrio no mesmo dia, assumindo que o ano tem 365 dias.
22. De uma caixa com etiquetas numeradas de 1 a 10, retiram-se duas ao acaso, com
reposio. Determine a probabilidade de que os nmeros nas etiquetas diram por 2.
23. No Brasil, a placa dos automveis uma string, na qual os 3 primeiros elementos so
letras escolhidas dentre as 26, e, os 4 ltimos, dgitos na base decimal.
(a) Qual o nmero mximo de automveis que podem ser emplacados neste sistema?
(b) Qual a probabilidade de que uma placa seja iniciada pela letra K?
24. Uma caixa contm bolas numeradas de 1 at n.
Campos & Rgo
2.9. EXERCCIOS 46
(a) Todas as bolas so retiradas da caixa aleatoriamente uma a uma.
(a1) Descreva o espao amostral.
(a2) Encontre a probabilidade de que os nmeros selecionados sejam inteiros
consecutivos em ordem crescente.
(b) Suponha a mesma caixa, com as mesmas bolas, mas agora a bola retirada, seu
nmero anotado e reposta na urna antes da retirada seguinte. Responda os
itens (a1) e (a2).
25. M cartes de Natal so distribudos aleatoriamente para N pessoas, N > M. Encontre
a probabilidade de que no mais que um carto de Natal seja enviado para cada pessoa.
26. Os nmeros 1, 2, , n so escritos de forma aleatria. Encontre a probabilidade de
que os dgitos
(a) 1 e 2,
(b) 1, 2 e 3,
apaream como vizinhos nessa ordem.
(c) Repita os itens (a) e (b) considerando apenas a condio de vizinhos.
27. (a) Suponha que os trs dgitos 1, 2 e 3 sejam escritos em ordem aleatria. Qual a
probabilidade de que ao menos um dgito ocupe seu lugar prprio?
(b) O mesmo que em (a) com os dgitos 1, 2, 3, e 4.
(c) O mesmo que em (a) com os dgitos 1, 2, , n.
(d) Examine a resposta em (c) quando n for grande.
28. Suponha que de N objetos, n < N sejam escolhidos ao acaso, com reposio. Qual
ser a probabilidade de que nenhum objeto seja escolhido mais do que uma vez?
29. Uma caixa contm etiquetas numeradas de 1, 2, , n. Duas etiquetas so escolhidas
ao acaso. Determine a probabilidade de que os nmeros das etiquetas sejam inteiros
consecutivos se:
(a) as etiquetas forem escolhidas sem reposio;
(b) as etiquetas forem escolhidas com reposio.
30. Dentre os nmeros 0, 1, , 9 so escolhidos ao acaso r nmeros (0 < r < 10), com
reposio. Qual a probabilidade de que no ocorram dois nmeros iguais?
31. Dois nmeros so selecionados aleatoriamente entre os nmeros 1, 2, . . . , n. Qual a
probabilidade de que a diferena entre o primeiro e o segundo nmeros escolhidos no
seja menor que m (m > 0).
32. Seja um alfabeto com 26 smbolos distintos a, b, , z. Considere como experimento
aleatrio a formao de strings de 3 smbolos, podendo os smbolos serem iguais.
Campos & Rgo
2.9. EXERCCIOS 47
(a) Descreva um espao amostral para este experimento.
(b) Qual a probabilidade de que uma string escolhida ao acaso dentre todas no
tenha elementos repetidos?
Campos & Rgo
Captulo 3
Probabilidade Condicional.
Independncia
3.1 Probabilidade Condicional
Como visto no Captulo 1, existem vrias possveis interpretaes de probabilidade. Por
exemplo, pode-se interpretar probabilidade de um evento A como um limite das frequncias
relativas de ocorrncia do evento A em realizaes independentes de um experimento. Por
outro lado, a interpretao subjetiva de probabilidade associa a probabilidade de um evento
A com o grau de crena pessoal que o evento A ocorrer. Em ambos os casos, probabilidade
baseada em informao e conhecimento. Reviso desta base de informao ou conheci-
mento pode levar a reviso do valor da probabilidade. Em particular, conhecimento que
determinado evento ocorreu pode inuenciar na probabilidade dos demais eventos.
Considerando-se a interpretao frequentista de probabilidade, suponha que o interesse
seja saber qual a probabilidade de do evento A, visto que sabe-se que o evento B ocorreu.
Suponha que se realizasse um experimento n vezes das quais o evento A (respectivamente, B
e AB) ocorre n
A
(respectivamente, n
B
> 0 e n
AB
0) vezes. Seja r
A
= n
A
/n a frequncia
relativa do evento A nas n realizaes do experimento. A probabilidade condicional de A
dado que sabe-se que B ocorreu segundo esta interpretao frequentista, sugere que ela deve
ser igual ao limite das frequncias relativas condicionais do evento A dado o evento B, isto ,
deve ser o limite da razo n
AB
/n
B
quando n tende ao innito. fcil provar que esta razo
igual a r
AB
/r
B
, que por sua vez segundo a interpretao frequentista de probabilidade
aproximadamente igual a P(A B)/P(B) para valores grandes de n.
Considerando-se uma interpretao subjetiva, suponha que a incerteza de um agente
descrita por uma probabilidade P em (, A) e que o agente observa ou ca sabendo que
o evento B ocorreu. Como o agente deve atualizar sua probabilidade P(|B) de modo a
incorporar esta nova informao? Claramente, se o agente acredita que B verdadeiro,
ento parece razovel requerer que
P(B
c
|B) = 0. (3.1)
Em relao aos eventos contidos em B, razovel assumir que sua chance relativa per-
manea inalterada se tudo que o agente descobriu foi que o evento B ocorreu, ou seja, se
48
3.1. PROBABILIDADE CONDICIONAL 49
A
1
, A
2
B com P(A
2
) > 0, ento
P(A
1
)
P(A
2
)
=
P(A
1
|B)
P(A
2
|B)
. (3.2)
Segue que (3.1) e (3.2) determinam completamente P(|B) se P(B) > 0.
Teorema 3.1.1: Se P(B > 0) e P(|B) uma medida de probabilidade em que satisfaz
(3.1) e (3.2), ento
P(A|B) =
P(A B)
P(B)
.
Prova: Como P(|B) uma medida de probabilidade e satisfaz P(B
c
|B) = 0, ento
P(B|B) = 1 P(B
c
|B) = 1. Considerando A
1
= A e A
2
= B em (3.2), logo P(A|B) =
P(A)
P(B)
para A B. Se A no um subconjunto de B, tem-se que A = (A B) (A B
c
). Como
(A B) e (A B
c
) so eventos disjuntos, P(A|B) = P(A B|B) + P(A B
c
|B). Como
A B
c
B
c
e P(B
c
|B) = 0, ento P(A B
c
|B) = 0. Como A B B, usando o caso
anterior
P(A|B) = P(A B|B) =
P(A B)
P(B)
.
Deste modo as interpretaes frequentista e subjetivista de probabilidade justicam a
seguinte denio.
Denio 3.1.2: Seja (, A, P) um espao de probabilidade. Se A, B A e P(B) > 0 a
probabilidade condicional de A dado B denida por
P(A|B) =
P(A B)
P(B)
.
Para um evento xo B que satisfaz P(B) > 0, P(|B) satisfaz aos axiomas K1-K4 (Ca-
ptulo 1) e realmente uma medida de probabilidade. Para provar K2, note que para todo
A A, como P(A B) 0,
P(A|B) =
P(A B)
P(B)
0.
Para provar K3, como B = B, ento
P(|B) =
P( B)
P(B)
=
P(B)
P(B)
= 1.
Finalmente, para provar (K5)

(que implica K4), se A


1
, A
2
, . . . so mutuamente exclusivos
A
1
B, A
2
B, . . . tambm o so, ento
Campos & Rgo
3.1. PROBABILIDADE CONDICIONAL 50
P(
i
A
i
|B) =
P((
i
A
i
) B)
P(B)
=
P(
i
(A
i
B))
P(B)
=

i
P(A
i
B)
P(B)
=

i
P(A
i
|B).
A probabilidade condicional tambm satisfaz s seguintes propriedades:
(i) P(B|B) = 1.
(ii) P(A|B) = P(A B|B).
(iii) Se A B, ento P(A|B) = 1.
(iv) P(A B|C) = P(A|B C)P(B|C).
Fazendo C = na propriedade (iv) acima,
P(A B) = P(A|B)P(B).
Utilizando induo matemtica, pode-se facilmente provar que
P(A
1
A
2
. . . A
n
) = P(A
1
)P(A
2
|A
1
) . . . P(A
n
|A
1
. . . A
n1
).
Um mtodo de se obter uma probabilidade (incondicional) de uma probabilidade condi-
cional utilizando o Teorema da Probabilidade Total.
Teorema 3.1.3: Seja a sequncia de eventos B
1
, B
2
, . . . uma partio de . ento para
todo A A
P(A) =

i:P(B
i
)=0
P(A|B
i
)P(B
i
).
Prova:
Como B
1
, B
2
, . . . uma partio de ,
A = A = A (
i
B
i
) =
i
(A B
i
).
Como os eventos B
i
s so mutuamente exclusivos, os eventos (A B
i
)s tambm so
mutuamente exclusivos. Ento o axioma (K5)

implica que
Campos & Rgo
3.1. PROBABILIDADE CONDICIONAL 51
P(A) = P(
i
(A B
i
))
=

i
P(A B
i
)
=

i:P(B
i
)=0
P(A B
i
)
=

i:P(B
i
)=0
P(A|B
i
)P(B
i
).
Se os eventos da partio B
1
, B
2
, . . . so interpretados como possveis causas e o evento
A corresponda a um efeito particular associado a uma causa, P(A|B
i
) especica a relao
estocstica entre a causa B
i
e o efeito A.
Por exemplo, seja {D, D
c
} uma partio do espao amostral, onde o evento D signica
que um dado indivduo possui uma certa doena. Seja A o evento que determinado teste para
o diagnstico da doena deu positivo. Ento, P(A|D
c
) descreve a probabilidade do exame d
positivo mesmo que o paciente esteja saudvel, a chamada probabilidade de falso positivo.
P(A
c
|D) a probabilidade do exame d negativo mesmo que o paciente esteja doente, a
chamada probabilidade de falso negativo. Estas probabilidades determinam a qualidade do
teste, quanto menores as probabilidades de falso negativo e falso positivo melhor a qualidade
do teste. Caso as probabilidades P(D), P(A|D), P(A|D
c
) sejam conhecidas pode-se usando o
Teorema da Probabilidade Total obter a probabilidade incondicional de determinado exame
dar positivo P(A). Porm, geralmente o que se busca saber que dado que o resultado de
um exame deu positivo qual a probabilidade de que o indivduo esteja doente. Pode-se obter
esta probabilidade utilizando a famosa frmula de Bayes:
P(D|A) =
P(A D)
P(A D) + P(A D
c
)
=
P(A|D)P(D)
P(A|D)P(D) + P(A|D
c
)P(D
c
)
.
Mais geralmente, a frmula de Bayes dada por:
P(B
i
|A) =
P(A B
i
)

j
P(A B
j
)
=
P(A B
i
)

j:P(B
j
)=0
P(A B
j
)
=
P(A|B
i
)P(B
i
)

j:P(B
j
)=0
P(A|B
j
)P(B
j
)
.
Os B
i
podem descrever, por exemplo, diferentes mensagens emitidas em um sistema de
comunicaes e A pode descrever uma mensagem recebida pelo sistema. P(A|B
i
) determina a
probabilidade que a mensagem B
i
seja emitida e a mensagem Aseja recebida por este sistema.
Essas probabilidades condicionais especicam o modelo do canal de comunicaes. Caso
Campos & Rgo
3.1. PROBABILIDADE CONDICIONAL 52
as probabilidades P(B
i
)s de cada mensagem ser enviada e as probabilidades condicionais
que descrevem o canal de comunicao sejam conhecidas pode-se usando o Teorema da
Probabilidade Total obter a probabilidade incondicional que determinada mensagem A seja
recebida. Porm geralmente, o que se busca saber que dado uma certa mensagem foi
recebida (efeito), A, qual a probabilidade de cada uma das mensagens B
i
terem sido as
mensagens enviadas. Podem-se obter estas probabilidades utilizando-se a frmula de Bayes.
fcil de provar a frmula de Bayes usando o Teorema da Probabilidade Total. As
probabilidades P(B
i
) so usualmente chamadas de probabilidades a priori e as probabilida-
des condicionais P(B
i
|A) de probabilidades a posteriori. O seguinte exemplo ilustra uma
aplicao da frmula de Bayes.
Exemplo 3.1.4: Considere uma imagem formada por n m pixels com a k-sima linha
contendo d
k
( m) pixels defeituosos. No primeiro estgio do experimento uma linha
escolhida ao acaso. A seguir, um pixel selecionado ao acaso nessa linha e constatado ser
defectivo; seja D este evento. Qual a probabilidade de que este pixel defeituoso esteja na
linha k?
Soluo: Seja R = k o evento que este pixel pertencia a k-sima linha da imagem. A
frmula de Bayes permite determinar que, dado que
P(R = k) =
1
n
e
P(D|R = k) =
d
k
m
,
tem-se que
P(R = k|D) =
1
n
d
k
m

n
i=1
1
n
d
i
m
=
d
k

n
i=1
d
i
.
Exemplo 3.1.5: Um sistema de comunicao telegrco transmite os sinais ponto (.) e
trao (-). A experincia tem mostrado que 2/5 dos pontos e 1/3 dos traos so mudados.
Suponha que a razo entre os pontos transmitidos e os traos transmitidos de 5 para 3.
Qual a probabilidade de que o sinal recebido seja o que foi transmitido quando
(a) o sinal recebido um ponto;
(b) o sinal recebido um trao.
Sejam os eventos
R

= {um ponto recebido},


R
_
= {um trao recebido},
T

= {um ponto transmitido},


T
_
= {um trao transmitido}.
e as probabilidades dadas no problema ou decorrentes de usar o complementar:
Campos & Rgo
3.1. PROBABILIDADE CONDICIONAL 53
P(R

| T

) =
3
5
, P(R

| T
_
) =
1
3
, P(R
_
| T

) =
2
5
, P(R
_
| T
_
) =
2
3
, P(T

) =
5
8
e
P(T
_
) =
3
8
.
Tem-se que:
R

= (R

) (R

T
_
),
R
_
= (R
_
T
_
) (R
_
T

),
logo,
P(R

) = P(R

| T

)P(T

) + P(R

| T
_
)P(T
_
) =
3
5
5
8
+
1
3
3
8
=
4
8
,
P(R
_
) = P(R
_
| T
_
)P(T
_
) + P(R
_
| T

)P(T

) =
2
3
3
8
+
2
5
5
8
=
4
8
.
(a)
P(T

| R

) =
P(R

)
P(R

)
=
3
4
.
(b)
P(T
_
| R
_
) =
P(T
_
R
_
)
P(R
_
)
=
1
2
.
Exemplo 3.1.6: Um canal de comunicao binrio envia um dentre dois tipos de sinais,
denotados por 0 e 1. Devido ao rudo, um 0 transmitido alguma vezes recebido como um
1 e um 1 transmitido alguma vezes recebido como um 0. Para um dado canal, assuma
uma probabilidade de 0.94 que um 0 transmitido seja corretamente recebido como um 0 e
uma probabilidade de 0.91 que um 1 transmitido seja corretamente recebido como um 1.
Adicionalmente, assuma uma probabilidade de 0.45 de se transmitir um 0. Se um sinal
enviado, determine,
(a) A probabilidade de que um 1 seja recebido.
(b) A probabilidade de que um 0 seja recebido.
(c) A probabilidade de que um 1 foi transmitido, dado que um 1 foi recebido.
(d) A probabilidade de que um 0 foi transmitido, dado que um zero foi recebido.
(e) A probabilidade de um erro.
Sejam os eventos
T
0
= {um 0 transmitido},
T
1
= {um 1 transmitido},
R
0
= {um 0 recebido},
R
0
= {um 1 recebido}.
Campos & Rgo
3.1. PROBABILIDADE CONDICIONAL 54
Logo,
P(R
0
| T
0
) = 0.94 P(R
1
| T
0
) = 0.06,
P(R
1
| T
1
) = 0.91 P(R
0
| T
1
) = 0.09,
P(T
0
) = 0.45,
P(T
1
) = 0.55.
(a)
R
1
= (R
1
T
1
) (R
1
T
0
),
logo,
P(R
1
) = P(R
1
| T
1
)P(T
1
) + P(R
1
| T
0
)P(T
0
) = 0.91 0.55 + 0.06 0.45 = 0.5275.
(b)
R
0
= (R
0
T
0
) (R
0
T
1
),
logo,
P(R
0
) = P(R
0
| T
0
)P(T
0
) + P(R
0
| T
1
)P(T
1
) = 0.94 0.45 + 0.09 0.55 = 0.4725,
ou,
P(R
0
) = 1 P(R
1
) = 1 0.5275 = 0.4725.
(c)
P(T
1
| R
1
) =
P(T
1
R
1
)
P(R
1
)
=
P(R
1
| T
1
)P(T
1
)
P(R
1
)
=
0.91 0.55
0.5275
= 0.9488.
(d)
P(T
0
| R
0
) =
P(T
0
R
0
)
P(R
0
)
=
P(R
0
| T
0
)P(T
0
)
P(R
0
)
=
0.94 0.45
0.4725
= 0.8952.
Campos & Rgo
3.1. PROBABILIDADE CONDICIONAL 55
(e)
E = {acontece um erro}.
Logo,
E = (T
1
R
0
) (T
0
R
1
),
P(E) = P(R
0
| T
1
)P(T
1
) + P(R
1
| T
0
)P(T
0
) = 0.09 0.55 + 0.06 0.45 = 0.0765.
Exemplo 3.1.7: Uma urna contm 4 bolas brancas e 6 bolas pretas. Sacam-se, sucessiva-
mente e sem reposio, duas bolas dessa urna. Determine a probabilidade da primeira bola
ser branca sabendo que a segunda bola branca.
Soluo: Sejam B
1
e B
2
os eventos a primeira bola branca e a segunda bola branca,
respectivamente. Queremos calcular P(B
1
|B
2
). Utilizando a frmula de Bayes,
P(B
1
|B
2
) =
P(B
2
|B
1
)P(B
1
)
P(B
2
|B
1
)P(B
1
) + P(B
2
|B
c
1
)P(B
c
1
)
.
Mas P(B
2
|B
1
) =
3
9
, P(B
2
|B
c
1
) =
4
9
, P(B
1
) =
4
10
e P(B
c
1
) =
6
10
. Logo,
P(B
1
|B
2
) =
3
9

4
10
3
9

4
10
+
4
9

6
10
=
2
15
2
5
=
1
3
.
Embora probabilidade condicional seja bastante til, ela sofre de problemas, em particu-
lar quando se quer tratar de eventos de probabilidade zero. Tradicionalmente, se P(B) = 0,
ento P(A|B) no denida. Isto leva a um nmero de diculdades loscas em relao
a eventos com probabilidade zero. So eles realmente impossveis? Caso contrrio, quo
improvvel um evento precisa ser antes de ele ser atribudo probabilidade zero? Deve um
evento em algum caso ser atribudo probabilidade zero? Se existem eventos com probabili-
dade zero que no so realmente impossveis, ento o que signica condicionar em eventos
de probabilidade zero? Por exemplo, considere o espao de probabilidade ([0, 1], B, ) onde
B a -lgebra de Borel restrita a eventos contidos em [0, 1] e uma medida de pro-
babilidade na qual todo intervalo em [0, 1] possui probabilidade igual ao seu comprimento.
Seja B = {1/4, 3/4} e A = {1/4}. Como P(B) = 0, P(A|B) no denida. Porm parece
razovel assumir que neste caso P(A|B) = 1/2 j que intuitivamente implica que todos os
estados so equiprovveis, mas a denio formal de probabilidade condicional no permite
obter esta concluso.
Alguns dos problemas mencionados no pargrafo anterior podem ser tratados considerando-
se probabilidades condicionais (e no probabilidade incondicionais) como a noo fundamen-
tal, porm a discusso destes modelos est fora do escopo deste curso.
Exemplo 3.1.8: Se P(C|D) = 0, 4 e P(D|C) = 0, 5, que evento mais provvel C ou D?
Soluo:
P(C | D) =
P(C D)
P(D)
= 0.4 P(D) =
P(C D)
0.4
.
P(D | C) =
P(C D)
P(C)
= 0.5 P(C) =
P(C D)
0.5
.
Como
P(CD)
0.4
>
P(CD)
0.5
, ento D mais provvel que C.
Campos & Rgo
3.1. PROBABILIDADE CONDICIONAL 56
Exemplo 3.1.9: Se P(E) = 0, 4 e P(F) = 0, 7, o que pode-se concluir sobre P(E|F)?
Soluo: Por denio,
P(E|F) =
P(E F)
P(F)
.
Porm, max(P(E)+P(F)1, 0) P(EF) min(P(E), P(F)). Logo, 0, 1 P(EF)
0, 4, portanto
0, 1
0, 7
P(E|F)
0, 4
0, 7
.
Exemplo 3.1.10: (Paradoxo de Monty Hall) Monty Hall foi um popular apresentador
de programa de jogos em TV cujo jogo comeava mostrando ao participante trs portas
fechadas d
1
, d
2
, d
3
, onde atrs de apenas uma delas havia um prmio valioso. O participante
selecionava uma porta, por exemplo, d
1
, mas antes que a porta fosse aberta, Monty Hall,
que sabia em que porta estava o prmio, por exemplo, d
2
, abria a porta restante d
3
, que no
continha o prmio. O participante tinha ento permisso para car com sua porta original,
d
1
, ou escolher a outra porta fechada. A pergunta se melhor car com a porta original
ou trocar de porta. A frmula de Bayes utilizada para analisar este problema. Seja G uma
porta escolhida aleatoriamente para conter o prmio; Y a porta que o participante escolhe
primeiro; e M a porta que Monty Hall abre. O participante no tem qualquer conhecimento
a priori sobre a localizao do prmio, ou seja ele considera todas as portas equiprovveis, e
isto pode ser modelado por
P(G = d
i
|Y = d
j
) =
1
3
,
isto , todas as portas tm a mesma probabilidade de conter o prmio no importa qual porta
o participante escolha. Se o participante escolher uma porta que no contm o prmio, Monty
Hall necessariamente ter de abrir a porta que no contm o prmio, isto pode ser modelado
por
P(M = d
i
1
|Y = d
i
2
, G = d
i
3
) = 1,
onde i
1
, i
2
, i
3
{1, 2, 3} e so distintos. Se o participante escolher corretamente, por exemplo,
Y = G = d
i
2
, ento Monty Hall escolhe aleatoriamente entre as outras duas outras portas:
P(M = d
i
1
|Y = G = d
i
2
) =
1
2
, para d
i
1
= d
i
2
.
1
Para determinar se o participante deve trocar de porta, deve-se calcular
P(G = d
1
|Y = d
2
, M = d
3
) =
P(G = d
1
, Y = d
2
, M = d
3
)
P(Y = d
2
, M = d
3
)
=
P(M = d
3
|G = d
1
, Y = d
2
)P(G = d
1
|Y = d
2
)P(Y = d
2
)
P(M = d
3
|Y = d
2
)P(Y = d
2
)
=
P(M = d
3
|G = d
1
, Y = d
2
)P(G = d
1
|Y = d
2
)
P(M = d
3
|Y = d
2
)
=
1/3
P(M = d
3
|Y = d
2
)
.
1
A soluo depende como este caso resolvido.
Campos & Rgo
3.1. PROBABILIDADE CONDICIONAL 57
O Teorema da Probabilidade Total e a denio de probabilidade condicional so utilizados
para determinar o valor de P(M = d
3
|Y = d
2
).
P(M = d
3
|Y = d
2
) =
P(Y = d
2
, M = d
3
)
P(Y = d
2
)
=
P(Y = d
2
, M = d
3
, G = d
1
) + P(Y = d
2
, M = d
3
, G = d
2
) + P(Y = d
2
, M = d
3
, G = d
3
)
P(Y = d
2
)
=
P(M = d
3
|Y = d
2
, G = d
1
)P(G = d
1
|Y = d
2
)P(Y = d
2
)
P(Y = d
2
)
+
P(M = d
3
|Y = d
2
, G = d
2
)P(G = d
2
|Y = d
2
)P(Y = d
2
)
P(Y = d
2
)
+
P(M = d
3
|Y = d
2
, G = d
3
)P(G = d
3
|Y = d
2
)P(Y = d
2
)
P(Y = d
2
)
= P(M = d
3
|Y = d
2
, G = d
1
)P(G = d
1
|Y = d
2
)
+P(M = d
3
|Y = d
2
, G = d
2
)P(G = d
2
|Y = d
2
)
+P(M = d
3
|Y = d
2
, G = d
3
)P(G = d
3
|Y = d
2
)
= 1
1
3
+
1
2

1
3
+ 0 =
1
2
.
Logo, P(G = d
1
|Y = d
2
, M = d
3
) =
2
3
, e o participante deve trocar de porta de sua escolha
original d
2
para d
1
!
Exemplo 3.1.11: Seja D o evento que um indivduo selecionado ao acaso de uma populao
tem uma doena particular. A probabilidade que um indivduo selecionado ao acaso nesta
populao tenha determinada doena p
d
. Existe um teste para diagnstico desta doena
que sempre acusa presena da doena quando o indivduo tem a doena. Contudo, quando
o indivduo no tem a doena, o teste reporta falsamente que o indivduo tem a doena com
probabilidade p
t
. Seja TP o evento que o teste reporta positivamente que o indivduo tem
a doena. Formalmente,
P(D) = p
d
, P(TP|D) = 1, P(TP|D
c
) = p
t
.
Um indivduo pode estar interessado em saber a probabilidade P(D|TP) que ele tenha a
doena dado que o teste deu positivo. Se, por exemplo, a doena for rara, p
d
= 0, 001 e o
teste reportar falsamente com probabilidade pequena p
t
= 0, 05, ser visto que, apesar desta
pequena probabilidade do teste d um resultado errado, a probabilidade do indivduo ter a
doena pequena. Pela frmula de Bayes
P(D|TP) =
P(TP|D)P(D)
P(TP|D)P(D) + P(TP|D
c
)P(D
c
)
=
p
d
p
d
+ p
t
(1 p
d
)
= 0, 02.
Exemplo 3.1.12: Suponha que todos os bytes tenham a mesma probabilidade de ocorrn-
cia. Seja W o nmero de 1s em um byte. Considere os seguintes eventos:
A = {O primeiro e o segundo bit so iguais a 1}
Campos & Rgo
3.2. INDEPENDNCIA 58
e
B = {W um nmero mpar}.
Calcular P(A), P(B), P(B|A) e P(A|B).
Soluo:
P(A) =
||A||
||||
=
2
6
2
8
=
1
4
.
P(B) =
||B||
||||
=
_
8
1
_
+
_
8
3
_
+
_
8
5
_
+
_
8
7
_
2
8
=
1
2
.
P(B|A) =
P(A B
P(A)
,
onde P(A B) =
||AB||

=
(
6
1
)+(
6
3
)+(
6
5
)
2
8
=
1
8
. Portanto,
P(B|A) =
1
8
1
4
=
1
2
.
P(A|B) =
P(A B)
B
=
1
8
1
2
=
1
4
.
Exemplo 3.1.13: Dois dados so jogados, um aps o outro, e observa-se o evento a soma
dos dois dados igual a 9; ento, qual a probabilidade do primeiro dado ter dado resultado
4?
Soluo:
P(A|B) =
P(A B)
P(B)
=
1
36
4
36
=
1
4
.
3.2 Independncia
O que exatamente signica que dois eventos so independentes? Intuitivamente, isto signica
que eles no tm nada a ver um com o outro, so no relacionados; a ocorrncia de um no
tem qualquer inuncia sobre a ocorrncia do outro. A intuio por trs da frase o evento
A independente do evento B que o conhecimento sobre a tendncia para A ocorrer
dado que sabe-se que B ocorreu no alterada quando sabe-se que B ocorreu. Ento,
usando probabilidades condicionais pode-se formalizar esta intuio da seguinte forma: A
independente de B se P(A|B) = P(A). Mas usando a denio de probabilidade condicional,
chega-se a concluso que A independente de B se P(AB) = P(A)P(B). Como esta ltima
expresso denida inclusive para o caso de P(B) = 0, ela a expresso adotada como a
denio de independncia entre dois eventos.
Denio 3.2.1: O evento A independente do evento B se P(A B) = P(A)P(B).
Campos & Rgo
3.2. INDEPENDNCIA 59
Esta denio de independncia implica que independncia um conceito simtrico em
teoria da probabilidade, isto , A independente de B se e somente se B independente
de A. Note que esta denio tambm implica que eventos A e B so independentes se
P(A) = 0 ou P(B) = 0, o que pode gerar concluses no intuitivas se de fato P(A) = 0
ou P(B) = 0. Por exemplo, se P(A) = 0, ento A independente dele mesmo, porm
A certamente no no relacionado consigo mesmo. Similarmente, fcil provar que se
P(A) = 1, A independente dele mesmo. O seguinte teorema prova que estes so os nicos
casos em que um evento independente dele mesmo.
Teorema 3.2.2: A independente dele mesmo se e somente se P(A) = 0 ou P(A) = 1.
Prova:
P(A A) = P(A) = P(A)P(A) P(A) = 0 ou P(A) = 1.
Intuitivamente, se A independente de B o fato que B no ocorreu, ou seja que B
c
ocorreu, no deve alterar a probabilidade de A. Portanto, de se esperar que se A e B so
independentes, ento A e B
c
tambm so. O seguinte teorema prova que esta intuio
verdadeira.
Teorema 3.2.3: Se A e B so eventos independentes, A e B
c
(respectivamente A
c
e B,
A
c
e B
c
) tambm o so.
Prova:
A = A = A (B B
c
) = (A B) (A B
c
).
Ento, como A B e A B
c
so mutuamente exclusivos, o axioma K3 implica que
P(A) = P(A B) + P(A B
c
).
Como A e B so independentes,
P(A) = P(A)P(B) + P(A B
c
).
Rearrajando os termos e utilizando o fato que P(B
c
) = 1P(B), tem-se que P(AB
c
) =
P(A)P(B
c
).
O conceito de independncia tambm se aplica a uma coleo arbitrria de eventos
{A
i
}
iI
, onde I um conjunto de ndices. Neste caso, tm-se duas denies.
Denio 3.2.4: Uma coleo de eventos {A
i
}
iI
independente par a par se para todo
i = j I, A
i
e A
j
so eventos independentes.
Denio 3.2.5: Uma sequncia nita de eventos A
1
, A
2
, . . . , A
n
, n 1, mutuamente
independente se para todo I {1, . . . , n},
P(
iI
A
i
) =

iI
P(A
i
).
Campos & Rgo
3.2. INDEPENDNCIA 60
Denio 3.2.6: Uma coleo de eventos {A
i
}
iI
mutuamente independente se para
todo J I nito, {A
i
}
iJ
so mutuamente independentes.
Exemplo 3.2.7: Se = {1, 2, 3, 4} e P({w}) = 1/4, ento A = {1, 2}, B = {1, 3}, e
C = {2, 3} so eventos independentes par a par.
Soluo: Pode-se vericar isto pelo fato que
P(A B) = P({1}) =
1
4
=
1
2
1
2
= P(A)P(B).
Similarmente, pode-se provar o mesmo resultado para os outros pares. Contudo,
P(A B C) = P() = 0 = P(A)P(B)P(C) =
1
8
.
Ento, A, B, e C no so mutuamente independentes.
Exemplo 3.2.8: Se = {1, 2, 3, 4, 5, 6}, A = {1, 2, 4}, e B = {2, 3, 5}, ento construa uma
medida de probabilidade em tal que A e B sejam independentes.
Soluo: Seja p
i
a probabilidade do elemento i . Ento, para que A e B sejam inde-
pendentes,
P(A B) = p
2
= P(A)P(B) = (p
1
+ p
2
+ p
4
)(p
2
+ p
3
+ p
5
).
Por exemplo, pode-se escolher p
1
= p
2
= p
3
= p
6
=
1
4
e p
4
= p
5
= 0. Deste modo,
P(A B) =
1
4
e P(A) = P(B) =
1
2
.
Exemplo 3.2.9: O evento F de que um determinado sistema falhe ocorre se os eventos A
1
ou A
2
ocorrerem, mas o evento A
3
no ocorrer. Se A
1
, A
2
, A
3
so mutumente independetes
e P(A
1
) = 0.4, P(A
2
) = 0.35, e P(A
3
) = 0.1, ento calcule P(F).
Soluo: O evento F igual ao evento (A
1
A
2
) A
c
3
. Logo sua probabilidade igual a:
P(F) = P((A
1
A
2
) A
c
3
) = P(A
1
A
2
)P(A
c
3
)
= (P(A
1
) + P(A
2
) P(A
1
)P(A
2
))(1 P(A
3
)) = (0.4 + 0.35 0, 4 0.35)(0.9) = 0.549.
Exemplo 3.2.10: Assuma que A
1
, . . . , A
n
so eventos mutuamente independentes e que
P(A
i
) = p
i
. Calcular as probabilidades dos seguintes eventos:
(a) O evento A o evento onde todos estes eventos ocorrem:
P(A) = P(
n
i=1
A
i
) =
n

i=1
P(A
i
) =
n

i=1
p
i
.
(b) O evento B o evento que nenhum desses eventos ocorre:
P(B) = P(
n
i=1
A
c
i
) =
n

i=1
P(A
c
i
) =
n

i=1
(1 p
i
).
Campos & Rgo
3.3. EXERCCIOS 61
(c) O evento C o evento onde pelo menos um desses eventos ocorre:
P(C) = P(B
c
) = 1 P(B) = 1
n

i=1
(1 p
i
).
Exemplo 3.2.11: Joo e Jos disputam um jogo com uma moeda equilibrada. Cada
jogador lana a moeda duas vezes e vence o jogo aquele que primeiro obtiver dois resultados
iguais. Joo comea jogando e se no vencer passa a moeda para Jos e continuam alternando
jogadas. Qual a probabilidade de Joo vencer o Jogo?
Soluo: Seja A
k
o evento dois resultados iguais so obtidos na k-sima tentativa. Note
que P(A
k
) =
1
2
. Seja B
k
o evento Joo ganha na sua k-sima jogada. Ento,
B
1
= A
1
; B
2
= A
c
1
A
c
2
A
3
; B
3
= A
c
1
A
c
2
A
c
3
A
c
4
A
5
,
em geral,
B
k
= A
c
1
A
c
2
A
c
2k2
A
2k1
.
Portanto,
P(B
k
) = P(A
c
1
A
c
2
A
c
2k2
A
2k1
) = P(A
c
1
)P(A
c
2
) P(A
c
2k2
)P(A
2k1
) = (
1
2
)
2k1
,
onde a penltima igualdade se deve ao fato dos lanamentos serem independentes. Logo,
P(Joo vencer) = P(

k=1
B
k
) =

k=1
P(B
k
) =

k=1
(
1
2
)
2k1
=
2
3
.
3.3 Exerccios
1. Sabe-se que os eventos {B
1
, B
2
, B
3
} so disjuntos par a par e que sua unio igual
ao espao amostral. Estes eventos tm as probabilidades P(B
1
) = 0.2 e P(B
2
) = 0.3.
Existe um outro evento A tal que P(A|B
1
) = 0.3, P(A|B
2
) = 0.4 e P(A|B
3
) = 0.1.
Calcule:
(a) P(A).
(b) P(B
2
|A).
2. Considere os eventos A, B e C. Sendo A e B independentes, A e C independentes e
B e C mutuamente excludentes, mostre que A e B C so independentes.
3. Numa certa cidade, 75% de seus habitantes tm menos de 30 anos, enquanto os outros
25% tm mais de 30 anos. Sabendo-se que a taxa de alfabetizao entre os jovens,
idade < 30 anos de 40% e entre os no jovens, idade 30 anos, de 30%, calcule:
(a) a probabilidade de que um habitante escolhido ao acaso seja alfabetizado;
(b) a probabilidade de que um habitante alfabetizado ter menos de 30 anos.
Campos & Rgo
3.3. EXERCCIOS 62
4. Um centro de processamento de dados comprou um lote de 5000 chips, dos quais 1000
foram manufaturados pela fbrica A e o restante pela B. Sabe-se que 10% dos chips
produzidos por A e 5% dos produzidos por B, respectivamente, so defeituosos.
(a) Um chip escolhido aleatoriamente do lote. Qual a probabilidade de que seja
defeituoso?
(b) Um chip escolhido aleatoriamente do lote, observado, e constata-se que defei-
tuoso. Qual a probabilidade de que tenha sido produzido por A?
(c) Suponha que uma amostra de 20 chips seja retirada aleatoriamente do lote com-
prado. Qual ser a probabilidade de se encontrar na amostra pelo menos 1 de-
feituoso? (este item ser facilmente resolvido usando uma Binomial, a qual ser
vista posteriormente)
5. Um porta-nqueis contm moedas de prata e de cobre em igual nmero. Extraem-se
ao acaso e sem reposio duas moedas. Calcule a probabilidade de que:
(a) saia uma moeda de prata na segunda tiragem;
(b) uma e uma s das moedas seja de prata;
(c) a segunda moeda extrada seja de prata, sabendo-se que a primeira era de cobre;
(d) pelo menos uma das moedas seja de cobre.
6. Seja o espao amostral = {a, b, c, d, e} onde P({a, b, c}) =
1
2
e P({a}) =
1
4
.
(a) Determine as probabilidades de todos os eventos cujas probabilidades podem ser
computadas dos dados.
(b) Compute P({b, c, d} | {a, b, c}).
(c) Compute P({a} | {a, b, c}).
7. Sabe-se que em um centro de processamento de dados, 80% dos programas so escritos
em C, 20% em Haskell, e que 20% dos programas em C e 40% dos em Haskell compilam
da primeira vez.
(a) Qual a probabilidade de que um programa selecionado aleatoriamente compile
da primeira vez?
(b) Se um programa selecionado aleatoriamente compilar da primeira vez, qual a
probabilidade de que tenha sido escrito em Haskell?
8. Suponha que a ocorrncia ou no de chuva dependa das condies do tempo no dia
imediatamente anterior. Adimita que se chove hoje, chover amanh com probabilidade
0.7 e que se no chove hoje chover amanh com probabilidade 0.4. Sabendo-se que
choveu hoje, calcule a probabilidade que chover depois de amanh.
9. Em um teste de mltipla escolha, a probabilidade do aluno saber a resposta p.
Havendo m escolhas se ele sabe a resposta, responde corretamente com probabilidade
1; se no sabe, responde corretamente com probabilidade 1/m.
Campos & Rgo
3.3. EXERCCIOS 63
(a) Qual a probabilidade de que a pergunta tenha sido respondida corretamente?
(b) Qual a probabilidade que o aluno sabia a resposta dado que a pergunta foi res-
pondida corretamente?
10. Sejam A
1
, A
2
, . . . A
n
eventos independentes com p
k
= P(A
k
), k = 1, . . . , n. Obtenha a
probabilidade de ocorrncia dos seguintes eventos, em termos das probabilidades p
k
:
(a) A ocorrncia de exatamente um dos A
k
.
(b) A ocorrncia de exatamente dois dos A
k
.
(c) A ocorrncia de, no mximo, n 1 dos A
k
.
11. Considere as seis permutaes das letras a, b, c como tambm os triplets (a, a, a),
(b, b, b), (c, c, c). Seja consistindo dos nove triplets, cada um com probabilidade
1/9. Denindo os eventos
A
k
= { o k-simo lugar ocupado pela letra a },
para k = 1, , 3 mostre que eles so independentes dois a dois mas no so inde-
pendentes trs a trs (a questo tambm poderia ter sido: verique se os eventos so
mutuamente independentes).
12. Suponha que trs rapazes possuem bons idnticos. Cada um atira seu bon no centro
de uma mesa. Os bons so misturados e ento cada um seleciona aleatoriamente um
bon.
(a) Qual a probabilidade que nenhum dos trs tenha escolhido seu prprio bon?
(b) Resolva o mesmo problema para n.
13. Em um conjunto de N itens, M esto com defeito. So tomados n itens para inspeo.
Se m ou mais itens dessa amostra so defeituosos, o conjunto todo rejeitado. Encontre
a probabilidade de que isto acontea.
14. Durante um dado perodo de tempo, um radar detecta um alvo com probabilidade p.
Sabe-se que as deteces de alvos por perodos de tempo idnticos, so independentes
umas das outras. Encontre a probabilidade que o mssel seja detectado em ao menos
um dos n perodos de tempo idnticos.
15. Um computador consiste de n unidades. A conabilidade (tempo livre de falha) da
1a. unidade durante o tempo T p
1
, da 2a. unidade para o tempo T p
2
, e assim por
diante. As unidades falham independentemente umas das outras. Quando qualquer
unidade falha, o computador falha. Encontre a probabilidade de que o computador
falhe durante o tempo T.
16. Trs mensagens so enviadas atravs de trs canais de comunicao, cada uma das
quais pode ser transmitida com diferente exatido. A transmisso de uma mensagem
pode levar a um dos seguintes eventos:
Campos & Rgo
3.3. EXERCCIOS 64
A
1
= { a mensagem transmitida da forma correta};
A
2
= { a mensagem parcialmente distorcida};
A
3
= { a mensagem completamente distorcida}.
As probabilidades dos eventos A
1
, A
2
e A
3
so conhecidas e iguais a p
1
, p
2
e p
3
(p
1
+ p
2
+ p
3
= 1). Considerando que mensagens podem ser distorcidas ou trans-
mitidas corretamente independentemente umas das outras, encontre a probabilidade
dos seguintes eventos:
(a) A = {todas as trs mensagens so transmitidas da forma correta}.
(b) B = {pelo menos uma das mensagens completamente distorcida}.
(c) C = {no menos de duas mensagens so completamente ou parcialmente distorcidas}.
17. Durante um dado perodo de tempo, um software pode apresentar erros com probabili-
dade p
0
. Assumindo independncia entre os eventos considerados, quantos perodos de
tempo so necessrios para que erros sejam detectados com probabilidade no menor
que p?
18. Uma mensagem que est sendo transmitida atravs de um canal de comunicao con-
siste de n smbolos. Durante a transmissso, a probabilidade de cada um dos smbolos
serem distorcidos, independentemente uns dos outros, p. Por questes de segurana,
cada mensagem ento enviada k vezes.
(a) Encontre a probabilidade de que pelo menos uma das mensagens que est sendo
transmitida, no seja distorcida em qualquer um dos seus smbolos.
(b) Quantas vezes uma mensagem precisa ser repetida para que a probabilidade de
que pelo menos uma das mensagens no seja distorcida no seja menor que p?
19. Coloque V ou F nas sentenas abaixo:
(a) A e B independentes P(A B) = P(A) + P(B). ( )
(b) A e B independentes P(A B) = P(A) + P(B) P(A)P(B). ( )
(c) A e B independentes P(A B) = P(A)P(B). ( )
(d) A e B independentes P(A | B) = P(B). ( )
(e) A e B independentes P(A | B) = P(A). ( )
(f) A e B so excludentes A e B so independentes. ( )
Nos itens a seguir B = {bebo}, D = {dirijo}. Voc vai responder estes itens
tendo em vista que voc um cidado brasileiro responsvel, consciente
de que o futuro do seu pas depende de voc, alis, voc o futuro do
Brasil!
(g) B D. ( )
(h) B D. ( )
Campos & Rgo
3.3. EXERCCIOS 65
(i) P(D | B) = 1. ( )
(j) P(B | D) = 0. ( )
(k) B e D so eventos independentes. ( )
(l) B e D so eventos excludentes. ( )
20. Uma mensagem consistindo de n smbolos binrios "0"e "1" enviada. Cada smbolo
distorcido com uma probabilidade p. Por questes de segurana a mensagem repetida
duas vezes. A informao considerada correta se ambas as mensagens coincidem.
Encontre a probabilidade de que ambas as mensagens estejam distorcidas, a despeito
de coincidirem.
21. A causa de um acidente est sendo investigada e existem quatro hiptesis possveis: H
1
,
H
2
, H
3
e H
4
. Estatisticamente sabe-se que P(H
1
) = 0.2, P(H
2
) = 0.4, P(H
3
) = 0.3
e P(H
4
) = 0.1. J sabido que ocorreu o evento A = {falha no nvel do leo}. Pelas
mesmas estatsticas a probabilidade condicional do evento A dadas as hiptesis H
1
, H
2
,
H
3
e H
4
so, respectivamente, 0.9, 0, 0.2 e 0.3. Encontre as probabilidades a posteriori
para as hiptesis.
22. Um colgio composto de 70% de homens e 30% de mulheres. Sabe-se que 40%
dos homens e 60% das mulheres so fumantes. Qual a probabilidade de que um
estudante que foi visto fumando seja homem? (estes dados, atualmente, pelo menos
entre os alunos do CCEN e do CIn, ambos da UFPE s ao irreais, pois as probabilidades
de fumantes so quase zero!)
23. Suponha que os automveis tm igual probabilidade de serem produzidos na segunda,
tera, quarta, quinta e sexta-feira. As percentagens de automveis amarelos produzidos
nos diferentes dias da semana so: segunda, 4%; tera, quarta e quinta, 1%; sexta, 2%.
Se voc compra um automvel amarelo, qual a probabilidade de que o mesmo foi
produzido numa segunda-feira?
24. Um homem dispara 12 tiros independentemente num alvo. Qual a probabilidade de
que atinja o alvo pelo menos uma vez, se tem probabilidade 9/10 de atingir o alvo em
qualquer tiro?
25. Certo experimento consiste em lanar um dado equilibrado duas vezes, independente-
mente. Dado que os dois nmeros sejam diferentes, qual a probabilidade (condicional)
de:
(a) pelo menos um dos nmeros ser 6;
(b) a soma dos nmeros ser 8.
26. Trs prisioneiros
2
so informados por seu carcereiro que um deles foi escolhido aleato-
riamente para ser executado, e os outros dois sero libertados. O prisioneiro A pede
2
Este problema aparece em vrios livros as quais esto aqui presentes. Voc v alguma semelhana entre
o citado problema e o Paradoxo de Monty Hall?
Campos & Rgo
3.3. EXERCCIOS 66
ao carcereiro para lhe dizer condencialmente qual, de seus dois companheiros de cela,
ser libertado, armando que no h qualquer problema, pois ele ja sabe que pelo
menos um deles estar em liberdade. O carcereiro recusa-se a responder a pergunta,
argumentando que, se A soubesse qual de seus companheiros seria libertado, ento sua
prpria probabilidade de ser executado cresceria de 1/3 para 1/2. Que voc pensa
do julgamento de carcereiro? (S. M. Ross, Introduction to Probability Models. Fifth
Edition, Academic Press, 1972, pp. 20)
27. Consider three prisioners, A, B, and C. Two of the prisioners are to be released, and
the prisioners know this, but not the identities of the two. Prisioner A ask the guard
to tell him the identity of one prisioner other than himself who is to be released. The
guard refuses and explains himself by saying to prisioner A, your probability of being
released is now 2/3. If I tell you that B, say, is to be released, then you would be
one of only two prisioners whose fate is unknown and your probability of release would
consequently decrease to 1/2. Since I dontt want to hurt your chances for release I am
not going to tell you. Is the guard correct in his reasoning? (R. Isaac, The Pleasures
of Probability. Springer-Verlag, 1995, pp. 24)
28. The Prisioners Dilemma. Three prisioners A, B, and C, with apparently equally
good records have applied for parele. The parole board has decided to release teo of
the three, and the prisioners know this but not which two. A warder friend of prisioner
A knows who are to be released. Prisioner A realizes that it would be unethical to
ask the warder if he, A, is to be released, but thinks of asking for the name of the one
prisioner other than himself who is to be released. He thinks that if the warder says
B will be released, his own chances have gone down to 1/2, because either A and B
or B and C are to be released. And so A decides not to reduce his chances by asking.
However, A is mistaken in his calculations. Explain. (F. Mosteller, Fifty Challenging
Problems in Probability. Dover Publications, Inc., New York, 1965, pp 28.)
29. Three prisioners A, B, and C, are locked in their cells. It is common knowledge that
one of them will be executed the next day and the others pardoned. Only the governor
knows which one will be executed. Prisioner A ask the guard a favor: Please ask
the governor who will be executed, and then take a message to one of my friends B
and C to let him know that he will be pardoned in the morning. The guard agrees,
and comes back later and tells A that he gave the pardon message to B. What are
As chances of being executed, given this information? (Answer this mathematically,
not by energetic waving of hands.) (S. Russel and P. Norvig, Artitial Intelligence A
Modern Approach. Prentice Hall, New Jersey , 1995.)
30. Num stand de automveis os registros indicam que 50% dos clientes pretendem ar
condicionado no carro, 49% preferem carro com direo hidrulica e 25% interessam-se
pelas duas coisas simultaneamente. Um registro selecionado aleatoriamente.
(a) Qual a probabilidade de que o ar condicionado tenha sido pretendido mas no a
preferncia do carro com direo hidrulica?
Campos & Rgo
3.3. EXERCCIOS 67
(b) Qual a probabilidade de que nenhuma das referidas preferncias tenha sido
selecionada?
(c) Qual a probabilidade de exatamente uma das referidas preferncias ter sido
selecionada?
31. Trs jornais A, B e C so publicados em uma cidade e uma recente pesquisa entre os
elitores indica o seguinte: 20% lem A; 26% lem B; 14% lem C; 8% lem A e B; 5%
lem A e C; 2% lem A, B e C; 4% lem B e C. Para um adulto escolhido ao acaso,
calcule a probabilidade de que:
(a) ele no leia qualquer dos jornais;
(b) ele leia exatamente um dos jornais;
(c) ele leia ao menos A e B se se souber que ele l ao menos um dos jornais publicados.
32. Uma mquina impressora pode imprimir n letras, digamos
1
,
2
,
n
. Ela acionada
por impulsos eltricos, cada letra sendo produzida por um impulso diferente. Suponha
que exista uma probabilidade constante p de imprimir a letra correta e tambm suponha
independncia. Um dos n impulsos, escolhido ao acaso, foi alimentado na mquina duas
vezes e, em ambas, a letra
1
foi impressa. Calcule a probabilidade de que o impulso
escolhido tenha sido para imprimir
1
.
33. Estima-se que a probabilidade de que Mrio seja culpado 0.2. So chamadas duas
testemunhas, Alberto e Carlos. Se Mrio for realmente culpado, Alberto dir que ele
culpado com certeza e Carlos dir que Mrio culpado com probabilidade 0.6. Se
Mrio for inocente, Alberto dir com probabilidade de 0.3 que ele inocente e Carlos
dir certamente que ele inocente.
(a) Qual a probabilidade de Alberto dizer que Mrio inocente?
(b) Qual a probabilidade de Mrio ser inocente se Carlos disser que inocente?
Campos & Rgo
Captulo 4
Variveis Aleatrias Unidimensionais e
Funes
4.1 Introduo
Analisando o trfego de redes Ethernet, o interesse pode ser, por exemplo, nas variveis n-
mero total de bytes, ou nmero total de pacotes, ou ainda, percentual de utilizao da rede
em determinados perodos de tempo. Suponha que uma moeda lanada cinco vezes. Qual
o nmero de caras? Quantidades desse tipo o que tradicionalmente tm sido chamadas
de variveis aleatrias. Intuitivamente, so variveis aleatrias porque seus valores variam,
dependendo da sequncia de lanamentos da moeda obtida ou do instante em que a rede
observada; o adjetivo aleatria usado para enfatizar que o seu valor de certo modo
incerto. Formalmente, contudo, uma varivel aleatria no nem aleatria nem varivel.
Na verdade, variveis aleatrias so funes, como ser visto a seguir. Uma varivel alea-
tria uma funo real. Sequncias de variveis aleatrias so sequncias de funes reais.
Convergncia de variveis aleatrias convergncia de funes reais e teoremas limite sobre
variveis aleatrias so teoremas limite sobre funes reais.
Denio 4.1.1: Seja (, A, P) um espao de probabilidade. Uma funo real X : R,
chamada de varivel aleatria se para todo Boreliano B, X
1
(B) A, onde X
1
(B) =
{ : X() B} o conjunto de elementos do espao amostral cuja imagem segundo X
est em B.
Figura 1
Notaes comumente encontradas, com os respectivos signicados:
[X = x] = { | X() = x}, B = {x},
[X x] = { | X() x}, B = (, x],
[x X y] = { | x X() y}, B = [x, y].
Dada uma varivel aleatria X, pode-se denir uma probabilidade, P
X
, no espao men-
survel (IR, B) da seguinte maneira: para todo B B, seja P
X
(B) = P(X
1
(B)). Por
68
4.2. FUNO DE DISTRIBUIO ACUMULADA 69
denio de varivel aleatria, tem-se que X
1
(B) A, ento P
X
est bem denida. P
X
satisfaz os axiomas K1, K2, e K5

de probabilidade, pois:
(K1) P
X
(B) = P(X
1
(B)) = P(A) 0.
(K2) P
X
(IR) = P(X
1
(IR)) = P() = 1.
(K5

) Suponha que B
1
, B
2
, . . . so eventos Borelianos disjuntos dois a dois. Ento,
P
X
(
n
B
n
) = P(X
1
(
n
B
n
)) = P(
n
(X
1
(B
n
))) =

n
P(X
1
(B
n
)) =

n
P
X
(B
n
).
A probabilidade P
X
dita como sendo a probabilidade induzida pela varivel aleatria
X.
4.2 Funo de Distribuio Acumulada
Para uma dada varivel aleatria X, uma maneira de descrever a probabilidade induzida P
X
utilizando sua funo de distribuio acumulada.
Denio 4.2.1: A funo de distribuio acumulada de uma varivel aleatria X, repre-
sentada por F
X
, denida por
F
X
(x) = P(X x) = P
X
((, x]), x IR.
A funo de distribuio acumulada F
X
satisfaz s seguintes propriedades:
(F1) Se x y, ento F
X
(x) F
X
(y).
x y (, x] (, y] P
X
((, x]) P
X
((, y]) F
X
(x) F
X
(y).
(F2) Se x
n
x, ento F
X
(x
n
) F
X
(x).
Se x
n
x, ento os eventos (, x
n
] so decrescentes e
n
(, x
n
] = (, x]. Logo,
pela continuidade da probabilidade, tem-se que P
X
((, x
n
]) P((, x]), ou seja,
F
X
(x
n
) F
X
(x).
(F3) Se x
n
, ento F
X
(x
n
) 0, e se x
n
, ento F
X
(x
n
) 1.
Se x
n
, ento os eventos (, x
n
] so decrescentes e
n
(, x
n
] = . Logo, pela
continuidade da probabilidade, tem-se que P
X
((, x
n
]) P(), ou seja, F
X
(x
n
) 0.
Similarmente, se x
n
, ento os eventos (, x
n
] so crescentes e
n
(, x
n
] = IR.
Logo, pela continuidade da probabilidade, tem-se que P
X
((, x
n
]) P(), ou seja,
F
X
(x
n
) 1.
Campos & Rgo
4.2. FUNO DE DISTRIBUIO ACUMULADA 70
Teorema 4.2.2: Uma funo real F satisfaz F1F3 se e somente se F uma funo de
distribuio de probabilidade acumulada.
Prova: A prova de que se F for uma funo de distribuio de probabilidade acumulada,
ento F satisfaz F1-F3 foi dada acima. A prova de que toda funo real que satisfaz F1-F3
uma funo de probabilidade acumulada est fora do escopo deste livro.
Uma funo de distribuio acumulada pode corresponder a vrias variveis aleatrias
no mesmo espao de probabilidade (, A, P). Por exemplo, seja X tal que P(X = 1) =
P(X = 1) =
1
2
. Logo, P(X = 1) = P(X = 1) =
1
2
. Portanto, X e X tm a mesma
distribuio. Consequentemente, F
X
= F
X
.
A condio F2 signica que toda funo distribuio de probabilidade acumulada F
X

continua direita. Ainda mais, como F
X
no-decrescente e possui valores entre 0 e 1,
pode-se provar que ela tem uma quantidade enumervel de descontinuidades do tipo salto.
Pela continuidade direita, o salto no ponto x igual a
F
X
(x) F
X
(x

) = F
X
(x) lim
n
F(x
1
n
)
= P
X
((, x]) lim
n
P
X
((, x
1
n
])
= lim
n
P
X
((x
1
n
, x]).
Como a sequncia de eventos (x
1
n
, x] decrescente e
n
(x
1
n
, x] = {x}, ento {x}
um Boreliano, pois limite de Borelianos, e
P
X
(x) = F
X
(x) F
X
(x

). (4.1)
Ou seja, a probabilidade da varivel aleatria X assumir o valor x igual ao salto da
funo de distribuio acumulada F
X
no ponto x. O prximo teorema indica que o conjunto
de pontos de descontinuidade de F enumervel.
Teorema 4.2.3: Seja D o conjunto de pontos de descontinuidade da funo de distribuio
F. Ento, D enumervel.
Prova: Pela monotonicidade, tem-se que para todo x IR, F(x

) F(x) F(x
+
). Logo,
x D se, e somente se, F(x
+
) > F(x

). Para n = 1, 2, 3, . . . seja
A
n
= {x : F(x
+
) F(x

) >
1
n
}.
Ento, D =

n=1
A
n
. Ser visto que todo A
n
contm menos que n pontos e, portanto,
nito, dessa forma, D ser enumervel.
Por absurdo, suponha que exista A
n
contendo n pontos. Assim, A
n
= {x
1
, x
2
, . . . , x
n
},
onde x
1
< x
2
< x
n
e
0 F(x

1
) F(x
+
1
) F(x

2
) F(x
+
2
) F(x

n
) F(x
+
n
) 1.
Campos & Rgo
4.2. FUNO DE DISTRIBUIO ACUMULADA 71
Ento,

n
k=1
[F(x
+
k
)F(x

k
)] 1. Mas por denio do conjunto A
n
, tem-se que F(x
+
i
)
F(x

i
) >
1
n
para todo x
i
A
n
. Portanto,

n
k=1
[F(x
+
k
) F(x

k
)] > n
1
n
> 1, absurdo.
Logo, A
n
contm menos que n pontos.
Exemplo 4.2.4: Este exemplo mostra como usar a funo de distribuio acumulada
para calcular probabilidades. O resultado em (b) j foi visto em 4.1. Sua reesposio aqui
tem como objetivo enfatizar a comutao do limite com a probabilidade para sequncias
monotnicas.
Lembrando que
F
X
(x) = P(X x) = P((, x]).
(a) (, b] = (, a] (a, b], a b
P((, b]) = P((, a]) + P((a, b])
P((a, b]) = P((, b]) P((, a]) = F
X
(b) F
X
(a)
P(a < X b) = F
X
(b) F
X
(a). (4.2)
(b) I
n
= {x : a
1
n
< x a +
1
n
}. Isto signica que I
1
I
2
lim
n
I
n
=

n=1
I
n
=
{a}. Sabe-se que (Captulo 1) P(limI
n
) = limP(I
n
). Portanto,
P(X = a) = P(

n=1
I
n
)
= P( lim
n
I
n
)
= lim
n
P(I
n
)
= lim
n
P(a
1
n
< X a +
1
n
)
= lim
n
(F
X
(a +
1
n
) (F
X
(a
1
n
))
= lim
n
F
X
(a +
1
n
) lim
n
F
X
(a
1
n
)
P(X = a) = F
X
(a
+
) F
X
(a

). (4.3)
A expresso 4.3 o salto da funo de distribuio no ponto a. Se X uma varivel
aleatria discreta, F
X
(a
+
) F
X
(a

) 0.
(c) (a, b) {b} = (a, b]
P((a, b)) +P({b}) = P((a, b])
P((a, b)) = P((a, b]) P(b) = F
X
(b) F
X
(a) P(X = b)
P(a < X < b) = F
X
(b) F
X
(a) P(X = b). (4.4)
O resultado em 4.4 foi obtido usando 4.2 e 4.3.
Campos & Rgo
4.3. TIPOS DE VARIVEIS ALEATRIAS 72
(d) (a, b] {a} = [a, b]
P((a, b]) + P(a) = P([a, b])
P([a, b]) = P((a, b]) + P(X = a) = F
X
(b) F
X
(a) + P(X = a)
P(a X b) = F
X
(b) F
X
(a) + P(X = a). (4.5)
O resultado em 4.5 foi obtido usando 4.2 e 4.3 .
(e) [a, b) = (a, b) {a}
P([a, b)) = P((a, b)) +P(a) = F
X
(b) F
X
(a) P(X = b) + P(X = a)
P(a X < b) = F
X
(b) F
X
(a) (P(X = b) P(X = a)). (4.6)
4.6 foi obtida a partir de 4.4.
(f) (, b] = (, b) {b}
P((, b]) = P((, b)) +P(X = b)
P((, b)) = P((, b]) P(X = b)
P( < X < b) = F
X
(b) P(X = b). (4.7)
4.3 Tipos de Variveis Aleatrias
Existem trs tipos de variveis aleatrias: discreta, contnua e singular.
4.3.1 Varivel Aleatria Discreta
Denio 4.3.1: Uma varivel aleatria X discreta se assume valores num conjunto
enumervel com probabilidade 1, ou seja, se existe um conjunto enumervel {x
1
, x
2
, . . .} IR
tal que P(X = x
i
) 0, i 1 e P(X {x
1
, x
2
, . . .}) = 1.
A funo p() denida por
p(x
i
) = P
X
({x
i
}), i = 1, 2, . . .
e
p(x) = 0, x / {x
1
, x
2
, . . .},
chamada de funo probabilidade de X. Toda funo probabilidade uma funo real e
assume valores entre 0 e 1, sendo positiva para uma quantidade enumervel de pontos sendo
tal que

i
p(x
i
) = 1. De modo geral escreve-se
0 p(x
i
) 1,
Campos & Rgo
4.3. TIPOS DE VARIVEIS ALEATRIAS 73

i
p(x
i
) = 1.
O conjunto de pontos
(x
i
, p(x
i
)), i = 1, 2, . . . ,
usualmente denotado na literatura por distribuio de probabilidade da varivel aleatria
X.
Para esta varivel aleatria tem-se que
F
X
(x) =

i:x
i
x
p(x
i
).
Seja p : IR [0, 1], sendo p positiva para uma quantidade enumervel de pontos
{x
1
, x
2
, . . .} e satisfazendo

i
p(x
i
) = 1 e seja
P(B) =

x
i
B
p(x
i
), B B.
Prova-se que P(B) uma probabilidade em (R, B) (P satisfaz os axiomas de Kolmogorov).
Logo, a distribuio de uma varivel aleatria discreta X pode ser determinada tanto pela
funo de distribuio acumulada F
X
quanto pela sua funo de probabilidade p.
4.3.2 Varivel Aleatria Contnua
Denio 4.3.2: Uma varivel aleatria X contnua se existe uma funo real f
X
(x) 0
tal que
F
X
(x) =
_
x

f
X
(t)dt, x R.
A funo f
X
chamada de funo densidade de probabilidade de X. F
X
contnua e
f
X
(x) = F

X
(x).
Uma funo f(x) 0 densidade de alguma varivel aleatria se e somente se,
_

f(x)dx = 1, sendo neste caso fcil provar que a funo F denida por
_
x

f(t)dt satisfaz
s condies F1, F2, e F3. Portanto, pelo Teorema 4.2.2, F uma funo de distribuio
acumulada. Portanto, como para varivel aleatria discreta, a distribuio de uma varivel
aleatria contnua X pode ser determinada tanto pela funo de distribuio acumulada F
X
quanto pela sua funo densidade f
X
.
Uma varivel aleatria X tem densidade se F
X
a integral (de Lebesgue) de sua derivada;
sendo, neste caso, a derivada de F
X
uma funo densidade para X. Em quase todos os casos
encontrados na prtica, uma varivel aleatria X tem densidade se F
X
(i) contnua e (ii)
derivvel por partes, ou seja, se F
X
derivvel no interior de um nmero nito ou enumervel
de intervalos cuja unio IR.
Campos & Rgo
4.3. TIPOS DE VARIVEIS ALEATRIAS 74
Por exemplo, seja
F
X
(x) =
_
_
_
0 se x < 0,
x se 0 x < 1,
1 se x 1.
Ento X tem densidade pois F
X
contnua e derivvel em todos os pontos da reta exceto
em {0, 1}.
Quando X uma varivel aleatria contnua,
P(X < b) = F
X
(b) P(X = b)
= F
X
(b) (F
X
(b
+
) F
X
(b

))
= F
X
(b)
= P(X b).
4.3.3 Varivel Aleatria Singular
Denio 4.3.3: Uma varivel aleatria X singular se F
X
uma funo contnua cujos
pontos de crescimento formam um conjunto de comprimento (medida de Lebesgue) nulo.
Na prtica, a maioria das variveis aleatrias discreta ou contnua.
O exemplo de uma varivel aleatria singular a funo de Cantor, cuja construo
segue-se.
Exemplo 4.3.4: Seja
F
0
(x) =
_
0, x < 0,
1, x > 1.
Dividindo-se o intervalo (0, 1) nos trs subintervalos (0,
1
3
), (
1
3
,
2
3
) e (
2
3
, 1) e considerando-
se como valor de F em (
1
3
,
2
3
) a mdia dos valores de F
0
fora de (0, 1), isto ,
0+1
2
=
1
2
,
obtm-se F
1
(x):
F
1
(x) =
_
_
_
0, x < 1,
1
2
,
1
3
< x <
2
3
,
1, x > 1.
Cada tero do intervalo (0, 1) sendo dividido em trs partes equivale a dividir (0, 1) em
nove partes. Para o intervalo (
1
9
,
2
9
), o valor da F
0+
1
2
2
=
1
4
; para o intervalo (
7
9
,
8
9
), o valor
da F
1
2
+1
2
=
3
4
.
Este processo constri uma sequncia de funes F
n
(x), n = 1, 2, , cuja funo limite,
F(x), satisfaz s propriedades F1, F2, F3. Alm disso, F uma funo contnua cuja derivada
igual a zero exceto em um conjunto de pontos que tem comprimento nulo. Portanto, F
uma funo de distribuio, entretanto no nem discreta, nem contnua, uma varivel
aleatria singular.
Campos & Rgo
4.4. FUNES DE VARIVEIS ALEATRIAS 75
4.3.4 Decomposio de uma Varivel Aleatria
Pode ser visto (James, 1981) que toda varivel aleatria uma combinao dos trs tipos:
discreta, contnua e singular; entretanto, as variveis aleatria que so comuns no mundo
real ou so discretas, ou contnuas, ou uma combinao entre esses dois tipos (mistas).
O exemplo a seguir mostra como decompor F em suas partes discreta, contnua e singular.
Exemplo 4.3.5: Suponha que X U[0, 1] e Y = min(X, 1/2). Note que
F
Y
(x) =
_
_
_
0 se x < 0,
x se 0 x < 1/2,
1 se x 1/2.
F
Y
tem apenas um salto em x = 1/2 e p
1
= 1/2. Logo, F
d
(x) = 0 se x < 1/2 e
F
d
(x) = 1/2 se x 1/2. Diferenciando F
Y
, tem-se
F

Y
(x) =
_
0 se x < 0 ou x > 1/2,
1 se 0 < x < 1/2.
Logo, por denio,
f(x) =
_
0 se x 0 ou x 1/2,
1 se 0 < x < 1/2.
Portanto,
F
ac
(x) =
_
x

f(t)dt =
_
_
_
0 se x < 0,
x se 0 x 1/2,
1/2 se x > 1/2.
Como F
d
+ F
ac
= F
Y
, tem-se que F
s
(x) = 0, x IR e no h parte singular.
Uma varivel aleatria que possui apenas partes discreta e absolutamente contnua
conhecida como uma varivel aleatria mista. Na prtica, pouco provvel que surja uma
varivel aleatria singular. Portanto, quase todas as variveis aleatrias so discretas, con-
tnuas ou mistas.
4.4 Funes de Variveis Aleatrias
Muitas vezes dada a distribuio de probabilidade que descreve o comportamento de uma
varivel aleatria X denida no espao mensurvel (, A), mas o interesse na descrio de
uma funo Y = H(X). Por exemplo, X pode ser uma mensagem enviada em um canal de
telecomunicaes e Y ser a mensagem recebida.
Uma pergunta inicial : se X uma varivel aleatria

X, log X, X
2
, 2X3 so variveis
aleatrias? Se sim, (o que verdade), sendo conhecida a distribuio de probabilidade de
X, como esse fato pode ser usado para encontrar a lei de probabilidade de

X, log X, X
2
ou 2X 3?
O problema determinar P(Y C), onde C um evento Boreliano. Para determinar
essa probabilidade, a imagem inversa da funo H fundamental, ou seja, a probabilidade
Campos & Rgo
4.4. FUNES DE VARIVEIS ALEATRIAS 76
do evento {Y C} ser por denio igual a probabilidade do evento {X H
1
(C)},
onde H
1
(C) = {x IR : H(x) C}. Para que esta probabilidade esteja bem denida,
preciso restringir H tal que H
1
(C) seja um evento Boreliano para todo C Boreliano,
caso contrrio no possvel determinar P({X H
1
(C)}); uma funo que satisfaz esta
condio conhecida como mensurvel com respeito a B. Note que Y tambm pode ser
vista como uma funo do espao amostral , Y () = H(X()) para todo . Vista
dessa maneira Y uma varivel aleatria denida em (, A), pois para todo Boreliano
C, Y
1
(C) = X
1
(H
1
(C)) e como por suposio H
1
(C) Boreliano porque X uma
varivel aleatria, tem-se que X
1
(H
1
(C)) A e portanto satisfaz a denio de uma
varivel aleatria. A gura abaixo exibe os espaos mensurveis e as transformaes entre
eles.
Figura 2
Seja A = { : X() B}. Portanto, como j mencionado anteriormente, a
probabilidade induzida pela varivel aleatria tal que
P
X
(B) = P(X
1
(B)) = P(A).
De forma similar, sendo
B = Y
1
(C){x IR : H(x) C}
ento,
P
Y
(C) = P
H(X)
(C) = P
X
({x IR : H(x) C}) = P({ : H(X()) C}),
e assim,
P
Y
(C) = P
X
(Y
1
(C)).
Logo,
P
Y
(C) = P
X
(B) = P(A).
A funo H da varivel aleatria X dene uma varivel aleatria no espao de proba-
bilidade (IR, B, P
Y
), onde a medida de probabilidade P
Y
induzida pela varivel aleatria
Y = H(X). P
Y
est bem denida pois
Y
1
(C) = B B,
o que mostra que a imagem inversa do conjunto mensurvel C o conjunto mensurvel B.
Adicionalmente, P
Y
satisfaz os axiomas K1, K2, e K5

porque:
(K1)
P
Y
(C) = P
X
(Y
1
(C)) = P
X
(B) = P(X
1
(B)) = P(A) 0.
(K2)
P
Y
(IR) = P
X
(Y
1
(IR)) = P
X
(IR) = P(X
1
(IR)) = P() = 1.
Campos & Rgo
4.4. FUNES DE VARIVEIS ALEATRIAS 77
(K5

) Sejam C
1
, C
2
, . . . , Borelianos tais que C
i
C
j
= , para todo i = j e Y
1
(C
n
) = B
n
.
Ento,
P
Y
(
n
C
n
) = P
X
(Y
1
(
n
C
n
))
= P
X
(
n
B
n
)
=

n
P
X
(B
n
)
=

n
P
X
(Y
1
(C
n
)
=

n
P
Y
(C
n
).
Os exemplos a seguir ilustram como calcular a distribuio de probabilidade de uma
funo de varivel aleatria. Ressalta-se a importncia fundamental da funo de distribuio
acumulada, F, e de grcos para visualizar as regies C e B.
Exemplo 4.4.1: X, discreta; H(X), discreta. Admita-se que X tenha os valores
possveis 1, 2, 3, . . . e suponha que P(X = n) = (1/2)
n
. Seja Y = 1 se X for par e Y = 1
se X for mpar.
Soluo: Ento,
P(Y = 1) =

n=1
(1/2)
2n
=

n=1
(1/4)
n
=
1/4
1 1/4
= 1/3.
Consequentemente,
P(Y = 1) = 1 P(Y = 1) = 2/3.
De modo geral, suponha que X assume os valores x
1
, x
2
, . . . e que H uma funo real
tal que Y = H(X) assume os valores y
1
, y
2
, . . .. Agrupando os valores que X assume de
acordo os valores de suas imagens quando se aplica a funo H, ou seja, denotando por
x
i1
, x
i2
, x
i3
, . . . os valores de X tal que H(x
ij
) = y
i
para todo j, tem-se que
P(Y = y
i
) = P(X {x
i1
, x
i2
, x
i3
, . . .}) =

j=1
P(X = x
ij
) =

j=1
p
X
(x
ij
),
ou seja, para calcular a probabilidade do evento {Y = y
i
}, acha-se o evento equivalente
em termos de X, isto , todos os valores x
ij
de X tal que H(x
ij
) = y
i
e somam-se as
probabilidades de X assumir cada um desses valores.
Exemplo 4.4.2: X, discreta; H(X), discreta. Seja X como no exemplo anterior e
H(X) = X
2
.
Soluo: O contradomnio da varivel Y , R
Y
, e as respectivas probabilidades so:
R
Y
= {0, 1, 4, . . . , n
2
, . . .},
Campos & Rgo
4.4. FUNES DE VARIVEIS ALEATRIAS 78
P(Y = 0) = P(X = 0) = p
0
,
P(Y = 1) = P(X = 1) = p
1
,
P(Y = 4) = P(X = 2) = p
2
,
. . .
P(Y = n
2
) = P(X = n) = p
n
.
. . .
Exemplo 4.4.3: X, contnua; H(X), discreta. Seja f
X
(x) = 2x, 0 < x < 1 e Y = H(X)
denida por Y = 0 se X <
1
3
, Y = 1, se
1
3
X <
2
3
e Y = 2, se X
2
3
.
Soluo: Em termos de eventos equivalentes tem-se que:
C
1
= {Y = 0} B
1
= {X <
1
3
},
C
2
= {Y = 1} B
2
= {
1
3
X <
2
3
},
C
3
= {Y = 2} B
3
= {X
2
3
}.
Logo,
P(Y = 0) = P(X <
1
3
) =
_ 1
3
0
2xdx =
1
9
,
P(Y = 1) = P(
1
3
< X
2
3
) =
_ 2
3
1
3
2xdx =
3
9
,
P(Y = 2) = P(X
2
3
) =
_
1
2
3
2xdx =
5
9
,
Exemplo 4.4.4: X, contnua; H(X), contnua. Seja a densidade de X como no exemplo
anterior e Y = H(X) = e
X
.
Soluo: O evento onde a densidade de X no nula B = {0 < X < 1}.
Portanto, a densidade de Y est concentrada em {y = H(x) : x B} = {e
1
< y + 1} e
F
Y
(y) = P(Y y)
= P(e
X
y)
= P(X ln y)
= P(X ln y)
=
_
1
ln y
2xdx
= 1 (ln y)
2
f
Y
(y) =
2 ln y
y
.
Campos & Rgo
4.4. FUNES DE VARIVEIS ALEATRIAS 79
Logo,
f
Y
(y) =
_
2 lny
y
, y (e
1
, 1),
0, y (e
1
, 1).
Exemplo 4.4.5: Se f
X
(x) = 1, 0 < x < 1, e zero para quaisquer outros valores, qual a
distribuio de Y = log(X)?
Soluo: Como
0 < Y < 0 < X < 1
e P(0 < X < 1) = 1, tem-se F
Y
(y) = 0, y 0. Se y > 0, ento
P(Y y) = P(log(X) y) = P(X e
y
) = 1 e
y
,
ou seja, Y Exp(1), isto , uma Exponencial (que ser vista depois) de parmetro 1.
No exemplo a seguir X contnua e H(X) contnua. A nfase deste exemplo mostrar
o cuidado na busca dos eventos equivalentes.
Exemplo 4.4.6: Seja f
X
(x) =
1
3
x
2
, 1 < x < 2 e zero para quaisquer outros valores de x.
Encontrar a funo densidade da varivel aleatria Y = X
2
.
Soluo: Portanto, como pode ser visto na gura abaixo,
Figura 3
1 < x < 1 0 < y < 1
e
1 x < 2 1 y < 4.
Ento,
F
Y
(y) = P(Y y)
= P(X
2
y)
= P(

y X

y)
= F
X
(

y) F
X
(

y) + P(X =

y)
=
_
F
X
(

y) F
X
(

y), 0 < y < 1,


F
X
(

y), 1 y < 4.
Portanto,
f
Y
(y) =
_
_
_

y
3
, y (0, 1),

y
6
, y [1, 4).
0, y (0, 4).
No caso de X e Y serem contnuas, tem-se o teorema seguinte.
Campos & Rgo
4.4. FUNES DE VARIVEIS ALEATRIAS 80
Teorema 4.4.7: Seja H uma funo diferencivel, crescente ou decrescente em um dado
intervalo I, H(I) o contradomnio de H, H
1
a funo inversa de H e X uma varivel
aleatria contnua com funo densidade f
X
(x) > 0, se x I e f
X
(x) = 0, se x I. Ento,
Y = H(X) tem funo densidade de probabilidade dada por:
f
Y
(y) =
_
0, y H(I),
f
X
(H
1
(y))|
dH
1
(y)
dy
|, y H(I).
Prova:
(a) H crescente. Logo, H
1
tambm crescente em I. Portanto,
F
Y
(y) = P(Y y)
= P(H(X) y)
= P(X H
1
(y))
= F
X
(H
1
(y)).
Logo,
d
dy
F
Y
(y) =
d
dy
F
X
(H
1
(y)) =
dF
X
(H
1
(y))
dx
dx
dy
,
onde x = H
1
(y).
Mas,
d
dy
F
Y
(y) = F

Y
(y) = f
Y
(y).
Portanto,
dF
X
(H
1
(y))
dx
dx
dy
= F

X
(H
1
(y))
dH
1
(y)
dy
.
Logo,
f
Y
(y) = f
X
(H
1
(y))
dH
1
(y)
dy
, y H(I).
(b) H decrescente em I. Ento H
1
tambm decrescente em I. Logo,
F
Y
(y) = P(Y y)
= P(H(X) y)
= P(X H
1
(y))
= 1 F
X
(H
1
(y)) +P(X = H
1
(y))
= 1 F
X
(H
1
(y)).
Campos & Rgo
4.4. FUNES DE VARIVEIS ALEATRIAS 81
Porque P(X = H
1
(y)) = 0 e seguindo o procedimento visto em (a),
F

Y
(y) = F

X
(H
1
(y))
dH
1
(y)
dy
e assim
f
Y
(y) = f
X
(H
1
(y))
dH
1
(y)
dy
, y H(I).
Tambm pode-se utilizar o mtodo acima em outros casos em que a funo H no seja
nem crescente nem decrescente em I. Para tanto suponha que I possa ser dividido em uma
quantidade enumervel I
1
, I
2
, I
3
, . . . de subintervalos tal que H seja crescente ou decrescente
em cada um deles, P
X
(I
j
I
k
) = 0 e H(I
j
) = H(I
k
) para todo j = k. Neste caso, seja H
1
j
a funo inversa de H restrita ao subintervalo I
j
. Portanto,
F
Y
(y) = P(Y y)
= P(H(X) y)
=

j:H
1
j
crescente
P(X H
1
j
(y)) +

j:H
1
j
decrescente
P(X H
1
j
(y)).
Logo, pelos resultados anteriores,
f
Y
(y) =

j
f
X
(H
1
j
(y))|
d
dy
H
1
j
(y)|, y H(I).
Exemplo 4.4.8: Seja X com densidade f
X
(x) e Y = X
2
. Ento
Soluo:
F
Y
(y) = P(Y y)
= P(X
2
y)
= P(

y X

y)
= F
X
(

y) F
X
(

y) + P(X =

y)
= F
X
(

y) F
X
(

y),
porque P(X =

y) = 0. Logo,
d
dy
F
Y
(y) =
d
dy
(F
X
(

y) F
X
(

y)) =
d
dy
F
X
(

y)
d
dy
F
X
(

y).
Mas,
d
dy
F
Y
(y) = f
Y
(y),
Campos & Rgo
4.5. EXERCCIOS 82
d
dy
F
X
(

y) =
dF
X
(

y)
dx
1
dx
1
dy
, x
1
=

y,
dF
X
(

y)
dx
1
= f
X
(

y),
dx
1
dy
=
1
2

y
,
d
dy
F
X
(

y) =
dF
X
(

y)
dx
2
dx
2
dy
, x
2
=

y,
dF
X
(

y)
dx
2
= f
X
(

y),
dx
2
dy
=
1
2

y
.
Logo,
f
Y
(y) =
_
1
2

y
(f
X
(

y) + f
X
(

y)), y 0,
0, y < 0,
Alternativamente, poderia ter sudo usado o procedimento descrito anteriormente e par-
ticionar IR nos subintervalos I
1
= (, 0] e I
2
= [0, +). Note que P
X
(I
1
I
2
) = 0,
H(I
1
) = H(I
2
) = [0, +), H
1
1
(y) =

y e H
1
2
(y) =

y. Portanto,
f
Y
(y) = f
X
(

y)
1
2

y
+ f
X
(

y)
1
2

y
, y 0.
4.5 Exerccios
1. Resolva este exerccio usando um software adequado.
(a) Para cada uma das funes abaixo, faa seu grco; verique se uma funo
densidade de probabilidade para uma dada varivel aleatria X. Se for, encontre
a funo de distribuio acumulada e faa seu grco.
(a1) f
X
(x) = 6x(1 x), 0 x 1.
(a2)
f
X
(x) =
_
_
_
1 +x, 1 x 0,
1 x, 0 x 1,
0, quaisquer outros valores.
(a3) f
X
(x) = 1/(

2) exp (x
2
/2), x IR.
(a4)
f
X
(x) =
_

_
x/2, 0 x 1,
1/2, 1 x 2,
x/2 + 3/2, 2 x 3,
0, quaisquer outros valores.
Campos & Rgo
4.5. EXERCCIOS 83
(b) Seja a funo de distribuio acumulada da varivel aleatria X,
F
X
(x) =
_
_
_
0, x < 0,
(2/) sin
1
(

x), 0 x < 1,
1, x 1.
Faa o grco de F(). Determine a funo densidade de probabilidade e faa seu
grco.
2. Uma varivel aleatria contnua X tem funo densidade f
X
(x) = e
x
, x > 0 e
> 0.
(a) Determine a funo de distribuio acumulada de X.
(b) Calcule as seguintes probabilidades usando a funo encontrada no item anterior:
(b1) P(X 3).
(b2) P(X > 2).
(b3) P(X < 1).
(b4) P(X > 1).
3. Um ponto escolhido ao acaso sobre uma reta de comprimento L. Qual a proba-
bilidade de que a razo do segmento mais curto para o mais longo seja menor que
1/2?
4. Uma varivel aleatria X tem densidade f
X
() dada por
f
X
(x) =
_
_
_
x, 0 x < 0.5,
(1 x), 0.5 x < 1,
0, quaisquer outros valores.
(a) Determine o valor da constante .
(b) Sejam os eventos A = {X < 0.5}, B = {X > 0.5} e C = {0.25 < X < 0.75}.
(b1) Calcule P(A | B).
(b2) Verique se A, B e C so mutuamente independentes.
5. Um motorista tem que, obrigatoriamente, passar em 4 (e somente 4) semafros para
alcanar seu destino. Em cada um deles, independentemente, a probabilidade do carro
parar p. Seja uma varivel aleatria X, denida como sendo o nmero de semforos
que o carro passa antes de parar pela primeira vez. Estabelea a distribuio de
probabilidade de X. Prove que a expresso encontrada realmente uma distribuio
de probabilidade.
6. Em um jogo de dados, A paga R$20,00 a B e lana trs dados honestos. Se sair a face
1 em no mximo um dos dados, A ganha R$20,00 de B; se sair face 1 em dois dados
apenas, A ganha R$50,00; se sair face 1 nos trs dados, A ganha R$80,00. Determine
a distribuio de probabilidade do lucro lquido por jogada.
Campos & Rgo
4.5. EXERCCIOS 84
7. Seja uma varivel aleatria contnua X, com funo de densidade
f
X
(x) = e( | x |), com x IR e > 0.
(a) Determine a constante .
(b) Esboe o grco de f
X
(x).
(c) Determine F
X
(x).
(d) Determine m tal que P(X m) = P(X > m).
8. Suponha que a funo de distribuio acumulada para uma varivel aleatria X, F
X
(),
fosse denida por F
X
(x) = P(X < x). Usando esta denio determine as seguintes
probabilidades:
(a) P(X x).
(b) P(a X b).
(c) P(a X < b).
(d) P(a < X < b).
Sugestes: (, a] = (, a) {a}, (, a] (a, b) = (, b).
9. Seja f
U
(u) = e
u
, u 0. Mostre que f uma funo densidade. Encontre
_

0
uf
U
(u)du.
10. Suponhamos que dez cartas estejam numeradas de 1 at 10. Das dez cartas, retira-
se uma de cada vez, ao acaso e sem reposio, at retirar-se o primeiro nmero par.
Conta-se o nmero de retiradas necessrias. Exiba um bom modelo probabilstico para
este experimento.
11. Seja X uma varivel aleatria com densidade
f
X
(x) =
_
cx
2
, se 1 x 1,
0, caso contrrio.
(a) Determine o valor da constante c.
(b) Determine a funo de distribuio acumulada e esboe seu grco.
(c) Ache o valor tal que F
X
() = 1/4. ( o primeiro quartil da distribuio de X.)
(d) Ache o valor tal que F
X
() = 1/2. ( a mediana da distribuio de X.)
12. Uma varivel aleatria X tem funo distribuio
F
X
(x) =
_
_
_
1, se x > 1,
x
3
, se 0 x 1,
0, se x < 0.
Qual a densidade de X?
Campos & Rgo
4.5. EXERCCIOS 85
13. Uma varivel X tem funo de distribuio
F
X
(x) =
_

_
0, x < 0,
x
2
/2, se 0 x < 1,
3/4, se 1 x < 2,
(1/4)(x + 1), se 2 x < 3,
1, se x 3.
Determine o seguinte:
(a) P(X = 1/2);
(b) P(X = 1);
(c) P(X < 1);
(d) P(X 1);
(e) P(X > 2);
(f) P(1/2 < X < 5/2).
14. Calcule
(a) P(X > 2);
(b) P(X 0);
(c) P(X = 0);
(d) P(X < 0);
(e) P(X 0.5).
para uma varivel X que tem funo de distribuio
F
X
(x) =
_
1 0.75e
x
, se x 0,
0, se x < 0.
15. Seja a probabilidade da varivel aleatria X denida por P(A) =
_
A
f(x)dx, onde
f
X
(x) = cx/9, para 0 < x < 3. Sejam A
1
= {x | 0 < x < 1} e A
2
= {x | 2 < x < 3}.
Calcule
(a) o valor da constante c,
(b) P(A
1
),
(c) P(A
2
),
(d) P(A
1
A
2
),
(e) P(A
1
| A
2
).
16. Coloque V ou F nas sentenas abaixo:
(a) Uma varivel aleatria X s assume valores no intervalo [0, 1]. ( )
Campos & Rgo
4.5. EXERCCIOS 86
(b) Se X uma varivel aleatria contnua, ento X tambm uma varivel aleatria
discreta. ( )
(c) Se X uma varivel aleatria discreta ento X no pode ser contnua.
A recproca que verdadeira. ( )
(d) Se X uma varivel aleatria contnua, F
X
(x) =
_
x

f
X
(s)ds. ( )
(e) Se X uma varivel aleatria contnua, f
X
(f) =
d
dx
F
X
(x). ( )
(g) lim
x+
F
X
(x) = 0. ( )
(h) P(X A) =
_
A
F
X
(x)dx. ( )
(i) P(X A) =
_
A
f
X
(x)dx. ( )
17. Foguetes so lanados at que o primeiro lanamento bem sucedido tenha ocorrido. Se
isso no ocorrer at 5 tentativas, o experimento suspenso e o equipamento inspecio-
nado. Admita que exista uma probabilidade constante de 0.8 de haver um lanamento
bem sucedido e que os sucessivos lanamentos sejam independentes. Suponha que o
custo do primeiro lanamento seja k dlares, enquanto os lanamentos subsequentes
custam k/3 dlares. Sempre que ocorre um lanamento bem sucedido, uma certa quan-
tidade de informao obtida, a qual pode ser expressa como um ganho nanceiro de
c dlares. Seja T o custo lquido desse experimento. Estabelea a distribuio de
probabilidade de T.
18. Determine a densidade de Y = (b a)X +a, onde f
X
(x) = 1, se 0 < x < 1 e zero para
quaisquer outros valores.
19. Se X tem densidade f
X
(x) = e
|x|
/2, < x < +, qual a distribuio de
Y =| X |?
20. Uma varivel aleatria X tem uma densidade de probabilidade f
X
(x). Encontre a
funo densidade de probabilidade da varivel aleatria Y = aX + b, onde a e b so
constantes.
21. Uma varivel aleatria X tem uma densidade de probabilidade f
X
(x). Qual a funo
densidade de probabilidade da varivel aleatria Y =| 1 X |?
22. Uma varivel aleatria contnua X tem uma densidade de probabilidade f
X
(x). Con-
sidere a varivel Y = X. Encontre sua funo densidade f
Y
(y).
23. Uma varivel aleatria contnua X tem uma densidade de probabilidade f
X
(x). En-
contre a funo densidade f
Y
(y) do seu mdulo, Y =| X |.
24. Uma varivel aleatria X tem uma funo distribuio F
X
(x), e uma varivel aleatria
Y relaciona-se com X por Y = 2 3X. Encontre a funo distribuio F
Y
(y) da
varivel aleatria Y .
Campos & Rgo
4.5. EXERCCIOS 87
25. Dada uma varivel aleatria contnua X com funo densidade f
X
(x), encontre a dis-
tribuio da varivel aleatria
Y = sinal de X =
_
_
_
+1, se X > 0,
0, se X = 0,
1, se X < 0.
26. Uma varivel aleatria X tem uma densidade de probabilidade correspondente a reta
que passa pelos pontos (1, 0) e (1, 1), para x (1, 1), e zero fora. Uma varivel
aleatria Y relacionada a X por Y = 1 X
2
. Encontre a funo densidade f
Y
(y).
27. Uma varivel aleatria X tem densidade f
X
(x) = 1, no intervalo (0, 1) zero fora. Uma
varivel aleatria Y tem um relacionamento funcional monotonicamente crescente com
a varivel X tal que Y = (X). Encontre a funo distribuio F
Y
(y) e a funo
densidade f
Y
(y).
28. Seja X uma varivel aleatria tal que P(| X 1 |= 2) = 0. Expresse P(| X 1 | 2)
em termos da funo de distribuio F
X
.
29. Seja f
X
(x) =
1
3
, 1 < x < 2 e zero para quaisquer outros valores de X. Encontre a
funo distribuio da varivel aleatria Y = X
2
.
30. Seja X tendo funo probabilidade f
X
(x) = (
1
2
)
x
, x = 1, 2, e zero para quaisquer
outros valores de X. Encontre a funo probabilidade de Y = X
3
.
31. Seja X tendo funo probabilidade f
X
(x) = x
2
/9, 0 < x < 3, e zero para quaisquer
outros valores. Encontre a funo probabilidade de Y = X
3
.
32. Seja X tendo funo densidade f
X
(x) = 2xe
x
2
, 0 < x < , e zero para quaisquer
outros valores. Determine a densidade de Y = X
2
.
33. Seja X uma varivel aleatria contnua com funo densidade f
X
(x).
(a) Encontre a funo densidade de Y = X
2
.
(b) Se f
X
(x) = f(x), x, simplique a resposta encontrada em (a).
(c) Se f
X
(x) = 0 quando x 0, simplique a resposta encontrada em (a).
34. Uma varivel aleatria X tem funo densidade probabilidade denida por:
f
X
(x) =
_
_
_
c + x, 1 x 0,
c x, 0 x 1,
0, quaisquer outros casos.
(a) Calcule o valor da constante c.
(b) Seja o evento A = {x | 0.5 x 0.5}. Compute P(A).
Campos & Rgo
4.5. EXERCCIOS 88
(c) Encontre a funo de distribuio acumulada de X, F
X
, e usando a mesma calcule
P(X 0.5).
(d) Suponha que uma varivel Y assuma o valor 0 se X for negativa e 1, se X for
positiva ou nula. Encontre a distribuio de probabilidade dessa varivel.
Campos & Rgo
Captulo 5
Vetores Aleatrios e Funes
5.1 Introduo
Muitas vezes na vida real, o interesse na descrio probabilstica de mais de um carac-
terstico numrico de um experimento aleatrio. Por exemplo, na distribuio de alturas e
pesos de indivduos de uma certa classe. Para tanto preciso estender a denio de varivel
aleatria para o caso multidimensional.
Denio 5.1.1: Seja (, A, P) um espao de probabilidade. Uma funo

X : IR
n

chamada de um vetor aleatrio se para todo evento B Boreliano


1
de IR
n
,

X
1
(B) A.
Dado um vetor aleatrio

X, pode-se denir uma probabilidade induzida P

X
no es-
pao mensurvel (IR
n
, B
n
) da seguinte maneira: para todo B B
n
, dene-se P

X
(B) =
P(

X
1
(B)). Por denio de vetor aleatrio, tem-se que

X
1
(B) = A A, ento P

X
est
bem denida.
5.2 Funo de Distribuio Acumulada Conjunta
Para um vetor aleatrio

X, uma maneira bsica de descrever a probabilidade induzida P

X

utilizando sua funo de distribuio acumulada conjunta.
Denio 5.2.1: A funo de distribuio acumulada conjunta de um vetor aleatrio

X,
representada por F

X
ou simplesmente por F, denida por
F

X
(x) = P(B
x
) = P(X
1
x
1
, X
2
x
2
, . . . , X
n
x
n
), x IR
n
.
A funo de distribuio acumulada F

X
satisfaz s seguintes propriedades:
1
Um evento Boreliano em IR
n
se pertence a menor -lgebra que contem todas regies da seguinte
forma: B
x
= {(X
1
, X
2
, . . . , X
n
) : X
i
x
i
, 1 i n}.
89
5.2. FUNO DE DISTRIBUIO ACUMULADA CONJUNTA 90
(F1) Se x
i
y
i
, i n, ento F

X
(x) F

X
(y).
x
i
y
i
i n B
x
B
y
P(B
x
) P(B
y
) F

X
(x) F

X
(y).
(F2) F(x
1
, x
2
, . . . , x
n
) contnua a direita em cada uma das variveis. Por exemplo, se
y
m
x
1
, ento
F(y
m
, x
2
, . . . , x
n
) F(x
1
, x
2
, . . . , x
n
), quando m .
(F3a) Se para algum i n, x
i
, ento B
x
decresce monotonicamente para o conjunto
vazio . Logo, pela continuidade monotnica de probabilidade,
lim
x
i

X
(x) = 0.
(F3b) Se x
i
, ento B
x
cresce monotonicamente para o conjunto {X
1
x
1
, . . . X
i1

x
i1
, X
i+1
x
i+1
, . . . , X
n
x
n
}, ou seja a restrio em X
i
removida. Ento, pode-se
escrever
lim
x
i

X
(x) = F
X
1
,...,X
i1
,X
i+1
,...,Xn
(x
1
, . . . , x
i1
, x
i+1
, . . . , x
n
).
Portanto, a funo de distribuio acumulada conjunta de X
1
, . . . , X
n1
pode ser fa-
cilmente determinada da funo de distribuio acumulada conjunta de X
1
, . . . , X
n
fazendo x
n
. Observe que funes de distribuio acumuladas conjuntas de ordem
maiores determinam as de ordem menores, mas o contrrio no verdadeiro. Em
particular,
lim
x
F

X
(x) = 1.
A funo de distribuio acumulada de X
i
que se obtm a partir da funo acumulada
conjunta de X
1
, . . . , X
n
fazendo x
j
para j = i denominada de funo de
distribuio marginal de X
i
.
O prximo exemplo mostra que para n 2 as propriedades F1, F2, e F3 no so suci-
entes para que F seja uma funo de distribuio.
Exemplo 5.2.2: Seja F
0
: IR
2
IR uma funo denida no plano tal que F
0
(x, y) = 1
se x 0, y 0, e x + y 1, e F
0
(x, y) = 0, caso contrrio. claro que F1, F2, e F3 so
satisfeitas, mas F
0
no funo de distribuio de nenhum vetor aleatrio (X, Y ), porque
tem-se a seguinte contradio:
0 P(0 < X 1, 0 < Y 1)
= F
0
(1, 1) F
0
(1, 0) F
0
(0, 1) +F
0
(0, 0) = 1 1 1 + 0 = 1
O resultado acima vem de:
F
0
(1, 1) = P(X 1, Y 1),
Campos & Rgo
5.2. FUNO DE DISTRIBUIO ACUMULADA CONJUNTA 91
F
0
(1, 0) = P(X 1, Y 0),
F
0
(0, 1) = P(X 0, Y 1),
F
0
(0, 0) = P(X 0, Y 0),
Logo,
F
0
(1, 1) F
0
(1, 0) = P(X 1, Y 1) P(X 1, Y 0) (5.1)
= P({X 1, Y 1}) P({X 1, Y 0}) (5.2)
= P({X 1, Y 1} {X 1, Y 0}) (5.3)
= P(X 1, 0 < Y 1). (5.4)
A frmula 5.4 decorre de P(B A) = P(B) P(A), quando A B.
De forma similar
F
0
(0, 1) F
0
(0, 0) = P(X 0, Y 1) P(X 0, Y 0) = P(X 0, 0 < Y 1). (5.5)
Por m, de 5.4 e 5.5,
P(X 1, 0 < Y 1) P(X 0, 0 < Y 1) = P(0 < X 1, 0 < Y 1).
5.2.1 Vetor Aleatrio Discreto
Se

X for um vetor aleatrio discreto, ou seja assumir uma quantidade enumervel de valores
{x
1
, x
2
. . . , }, dene-se uma funo de probabilidade de massa conjunta, ou sua distribuio
de probabilidade conjunta p,
P(X
1
= x
1
, X
2
= x
2
, . . . , X
n
= x
n
) = p(x
1
, x
2
, . . . , x
n
) = p(x
i
)
tal que
p(x
i
) 0,

i=1
p(x
i
) = 1.
5.2.2 Vetor Aleatrio Contnuo
Seja

X = (X
1
, . . . , X
n
) um vetor aleatrio e F sua funo de distribuio acumulada con-
junta. Se existe uma funo f(x
1
, . . . , x
n
) 0 tal que
F(x
1
, . . . , x
n
) =
_
xn


_
x
1

f(t
1
, . . . , t
n
)dt
1
. . . dt
n
, (x
1
, . . . , x
n
) IR
n
,
ento f chamada de densidade conjunta das variveis aleatrias X
1
, . . . , X
n
, e neste caso,

X contnuo.
Similar ao caso unidimensional,

n
F(x
1
, . . . , x
n
)
x
1
, . . . , x
n
= f(x
1
, . . . x
n
).
Campos & Rgo
5.3. DISTRIBUIES MARGINAIS E CONDICIONAIS 92
5.3 Distribuies Marginais e Condicionais
Denio 5.3.1: A funo probabilidade de massa marginal ou a distribuio de probabi-
lidade marginal de X
i

p
X
i
(x
i
) =

x
1

x
i1

x
i+1

xn
p(x
1
, . . . , x
i1
, x
i+1
, . . . , x
n
).
Denio 5.3.2: A densidade marginal de X
i

f
X
i
(x
i
) =
_

f(x
1
, . . . , x
i1
, x
i+1
, . . . , x
n
)dx
1
. . . dx
i1
dx
i+1
. . . dx
n
.
A seguir ser visto como calcular probabilidades condicionais envolvendo variveis alea-
trias.
Denio 5.3.3: Sejam X e Y variveis aleatrias com distribuio de probabilidade
conjunta P(X = x
i
, Y = y
j
) = p(x
i
, y
j
), (i, j) pertencente ao contradomnio de (X,Y).
Ento, a distribuio condicional de X dada Y = y
j
, P(X = x | Y = y
j
),
P(X = x
i
| Y = y
j
) =
P(X = x
i
, Y = y
j
)
P(Y = y
j
)
=
p(x
i
, y
j
)
p
Y
(y
j
)
= p
X|Y
(x
i
|y
j
), p
Y
(y
j
) > 0. (5.6)
O leitor pode fazer uma analogia com a denio de probabilidade condicional vista
anteriormente. Facilmente observa-se que 5.6 uma probabilidade:
(i) P(X = x
i
| Y = y
j
) 0, porque quociente de probabilidades.
(ii)
P(X IR | Y = y
j
) =
P(X IR, Y = y
j
)
P(Y = y
j
)
=
P(Y = y
j
)
P(Y = y
j
)
= 1.
(iii)
P(

i=1
{X = x
i
} | Y = y
j
) =
P((

i=1
{X = x
i
}) {Y = y
j
})
P(Y = y
j
)
=
P(

i=1
({X = x
i
} {Y = y
j
}))
P(Y = y
j
)
=
P(

i=1
{X = x
i
, Y = y
j
})
P(Y = y
j
)
=

i=1
P(X = x
i
, Y = y
j
)
P(Y = y
j
)
=

i=1
P(X = x
i
| Y = y
j
).
Campos & Rgo
5.3. DISTRIBUIES MARGINAIS E CONDICIONAIS 93
Analogamente,
P(Y = y
j
| X = x
i
) =
P(X = x
i
, Y = y
j
)
P(X = x
i
)
.
Quando as variveis aleatrias X e Y so contnuas, o fato de P(Y = y) = 0, y em 5.6
torna necessria a adio de um conceito novo na denio das probabilidades condicionais.
Para resolver este caso, ser utilizado um argumento de limites. Suponha que o objetivo
seja denir P(X x|Y = y), onde Y uma varivel contnua. Por exemplo, X poderia ser
alturas de indivduos e Y seus respectivos pesos; ento {Y = y} signica que o peso est
xo e P(X x|Y = y) implica em mensurar todas as alturas menores ou iguais a x para o
peso xo em y. Deste modo, suponha que exista um intervalo I de comprimento contendo
y em seu interior. P(X x|Y = y) pode ser aproximada por
P(X x|Y I) =
P(X x, Y I)
P(Y I)
,
esta probabilidade est bem denida desde que P(Y I) > 0. Caso P(Y I) = 0,
para algum intervalo contendo y, a denio da probabilidade P(X x|Y = y) pode ser
arbitrria, pois tal valor y nunca ocorrer. Esta aproximao ser to melhor quanto menor
for . Desta forma, pode-se denir P(X x|Y = y) como sendo o limite P(X x|Y I)
quando tende a zero. Assumindo que (X, Y ) possui densidade conjunta f(x, y), tem-se:
P(X x|Y = y) = lim
0
P(X x, Y I)
P(Y I)
= lim
0
_
x

_
yI
f(x, y)dydx
_
yI
f(y)dy
.
Supondo f(x, y) contnua na regio em que y I,
P(X x|Y = y) = lim
0
_
x

f(x, y)dx
f(y)
=
_
x

f(x, y)
f(y)
dx.
Desta forma, denindo P(X x|Y = y) como a funo de distribuio acumulada
condicional de X dado Y = y, F
X|Y
(x|y), como uma densidade a derivada da distribuio
acumulada, ento,
Denio 5.3.4: A densidade condicional de X dada Y = y :
f(x | y) =
_
f(x,y)
f
Y
(y)
, (x, y) IR
2
, y, xo, e f
Y
(y) > 0,
0, quaisquer outros valores,
A expresso acima uma densidade pois:
(i) f(x | y) 0, (x, y) porque quociente de densidades.
Campos & Rgo
5.3. DISTRIBUIES MARGINAIS E CONDICIONAIS 94
(ii)
_
+

f(x | y)dx =
_
+

f(x, y)dx
f
Y
(y)
=
1
f
Y
(y)
_
+

f(x, y)dx
=
f
Y
(y)
f
Y
(y)
= 1.
De forma similar,
f(y | x) =
_
f(x,y)
f
X
(x)
, (x, y) IR
2
, x, xo, e f
X
(x) > 0,
0, quaisquer outros valores,
Exemplo 5.3.5: Determine as densidades condicionais de X dada Y e de Y dada X
quando
f(x, y) =
_
x + y, 0 x 1, 0 y 1,
0, caso contrrio.
Soluo: Obtendo as densidades marginais,
f
X
(x) =
_
1
0
(x + y)dy = x +
1
2
, se 0 x 1,
f
Y
(y) =
_
1
0
(x + y)dx = y +
1
2
, se 0 y 1.
Logo, as densidades condicionais so:
f(x|y) =
x + y
y +
1
2
, se 0 x 1, 0 y 1,
f(y|x) =
x + y
x +
1
2
, se 0 x 1, 0 y 1.
Exemplo 5.3.6: Determine as densidades condicionais de X dada Y e de Y dada X
quando
f(x, y) =
_
e
(x+y)
, x 0, y 0,
0, caso contrrio.
Soluo: Obtendo as densidades marginais,
f
X
(x) =
_

0
e
(x+y)
dy = e
x
, se x 0,
f
Y
(y) =
_

0
e
(x+y)
dx = e
y
, se y 0.
Campos & Rgo
5.4. INDEPENDNCIA ENTRE VARIVEIS ALEATRIAS 95
Logo, as densidades marginais so:
f(x|y) = e
x
, se x 0, y 0,
f(y|x) = e
y
, se x 0, y 0.
5.4 Independncia entre Variveis Aleatrias
SejamX
1
, X
2
, . . . , X
n
variveis aleatrias denidas no mesmo espao de probabilidade (, A, P).
Informalmente, as variveis aleatrias X
i
s so independentes se, e somente se, quaisquer
eventos determinados por qualquer grupo de variveis aleatrias distintas so independen-
tes; por exemplo, [X
1
< 5], [X
2
> 9], e [0 < X
5
3] so independentes. Formalmente,
Denio 5.4.1: Um conjunto de variveis aleatrias {X
1
, . . . , X
n
} mutuamente inde-
pendente se, e somente se, para quaisquer eventos Borelianos B
1
, . . . , B
n
,
P(X
1
B
1
, . . . , X
n
B
n
) =
n

i=1
P(X
i
B
i
).
O prximo teorema estabelece trs critrios para provar que um conjunto de variveis
aleatrias mutuamente independente.
Teorema 5.4.2: As seguintes condies so necessrias e sucientes para testar se um
conjunto {X
1
, . . . , X
n
} de variveis aleatrias mutuamente independente:
(i) F

X
(x) =

n
i=1
F
X
i
(x
i
).
(ii) Se

X for um vetor aleatrio discreto,
p

X
(x) =
n

i=1
p
X
i
(x
i
).
(iii) Se

X for um vetor aleatrio contnuo,
f

X
(x) =
n

i=1
f
X
i
(x
i
), (x
1
, . . . , x
n
) IR
n
.
Prova:
(i) Se {X
1
, . . . , X
n
} so variveis aleatrias mutuamente independentes, ento
F
X
1
,X
2
,...,Xn
(x
1
, x
2
, . . . , x
n
) = P(X
1
x
1
, . . . , X
n
x
n
)
=
n

i=1
P(X
i
x
i
) =
n

i=1
F
X
i
(x
i
), (x
1
, . . . , x
n
).
A prova da sucincia foge ao escopo do livro.
Campos & Rgo
5.4. INDEPENDNCIA ENTRE VARIVEIS ALEATRIAS 96
(ii) Se {X
1
, . . . , X
n
} so variveis aleatrias mutuamente independentes, ento
p
X
1
,X
2
,...,Xn
(x
1
, x
2
, . . . , x
n
) = P(X
1
= x
1
, . . . , X
n
= x
n
)
=
n

i=1
P(X
i
= x
i
) =
n

i=1
p
X
i
(x
i
), (x
1
, . . . , x
n
).
Reciprocamente, se a funo de probabilidade de massa conjunta fatora e se {x
i1
, x
i2
,
. . . , x
in
, . . .} so os possveis valores assumidos pela varivel aleatria X
i
, ento
P(X
1
B
1
, X
2
B
2
, . . . , X
n
B
n
) =

i:x
1i
B
1

i:x
ni
Bn
P(X
1
= x
1i
, . . . , X
n
= x
ni
)
=

i:x
1i
B
1

i:x
ni
Bn
p
X
1
,...,Xn
(x
1i
, . . . , x
ni
)
=

i:x
1i
B
1

i:x
ni
Bn
n

j=1
p
X
j
(x
ji
)
=
n

j=1
P(X
j
B
j
).
(iii) Consequncia direta de (a) e da denio de funo densidade.
Exemplo 5.4.3: Uma varivel aleatria contnua tem funo densidade conjunta f(x, y) =
15x
2
y denida no tringulo (0,0), (1,0) e (0,2). Determine as densidades marginais e verique
se X e Y so independentes.
Soluo: Obtendo as densidades marginais,
f
X
(x) =
_
22x
0
15x
2
ydy = 30x
2
(1 x
2
), se 0 x 1,
f
Y
(y) =
_ 2y
2
0
15x
2
ydx =
5y(2 y)
3
8
, se 0 y 2.
Como f(x, y) = f
X
(x)f
Y
(y), as variveis aleatrias no so independentes.
fcil observar utilizando a denio de probabilidade condicional que se X e Y so
independentes, ento para todo A e B boreliano tal que P(Y B) > 0,
P(X A|Y B) = P(X A),
ou seja, se X e Y so independentes o conhecimento do valor de Y no altera a descrio
probabilstica de X.
Campos & Rgo
5.5. FUNES DE VETORES ALEATRIOS 97
5.5 Funes de Vetores Aleatrios
O objetivo nesta seo , considerando o vetor aleatrio (X, Y ) onde X e Y so variveis
aleatrias denidas no mesmo espao de probabilidade (, A, P), encontrar a distribuio
de probabilidade de Z = H(X, Y ) sendo H uma funo real tal que seu domnio contm os
contradomnios de X e Y , respectivamente, R
X
e R
Y
.
Quando necessrio, os resultados sero mostrados para vetores n-dimensionais, quando
no, para vetores bidimensionais. J um bom comeo entender o procedimento para n = 2.
Considere primeiro o caso em que

X um vetor aleatrio discreto. Se

Y = H(

X) e sendo
x
i1
, x
i2
, x
i3
, . . . os valores de

X tal que H(x
ij
) = y
i
para todo j. Ento,
P(

Y = y
i
) = P(

X {x
i1
, x
i2
, x
i3
, . . .}) =

j=1
P(

X = x
ij
) =

j=1
p

X
(x
ij
),
ou seja, para calcular a probabilidade do evento {

Y = y
i
}, acha-se o evento equivalente
em termos de

X, isto , todos os valores x
ij
de

X tal que H(x
ij
) = y
i
e somam-se as
probabilidades de

X assumir cada um desses valores.
Seja agora o caso em que (X, Y ) e Z = H(X, Y ) so contnuos, xado z, a soluo geral
do problema :
F
Z
(z) = P(Z z)
= P(H(X, Y ) z)
= P((X, Y ) B
z
)
=
_ _
Bz
f(x, y)dxdy,
onde B
z
IR
2
, B
z
B
2
, isto , B
z
um elemento da -lgebra de Borel sobre IR
2
,
B
z
= {(x, y) : H(x, y) z}.
Se for possvel obter uma funo g 0 tal que
_ _
Bz
f(x, y)dxdy =
_
z

g(v)dv
ento,
g() = f
Z
(),
isto , g a densidade de Z, f
Z
().
O que ser feito a seguir como usar este resultado para encontrar a distribuio da
soma, produto e quociente de X e Y .
Campos & Rgo
5.5. FUNES DE VETORES ALEATRIOS 98
5.5.1 Distribuio de Z = X + Y
Seja Z = X + Y e z xo. Ento,
B
z
= {(x, y) : x + y z}
= {(x, y) : < x < +, < y z x}.
tem gura aqui Figura A
F
Z
(z) =
_ _
Bz
f(x, y)dxdy
=
_
+

(
_
zx

f(x, y)dy)dx.
Fazendo uma mudana de varivel na integral interna:
y = v x dy = dv.
Como y z x ento v x z x v z. Logo, < v z < + e portanto v
varia de a z. Assim.
F
Z
(z) =
_
+

(
_
z

f(x, v x)dv)dx
=
_
z

(
_
+

f(x, v x)dx)dv.
Logo,
f
X+Y
(z) =
_
+

f(x, z x)dx, < z < +. (5.7)


Se X e Y forem independentes 5.7 torna-se
f
X+Y
(z) =
_
+

f
X
(x)f
Y
(z x)dx, < z < +. (5.8)
De 5.8 tem-se que a densidade da soma de duas variveis aleatrias independentes a
convoluo das densidades marginais.
Se X e Y forem independentes e no-negativas 5.7 torna-se
f
X+Y
(z) =
_
z
0
f
X
(x)f
Y
(z x)dx, z > 0.
Campos & Rgo
5.5. FUNES DE VETORES ALEATRIOS 99
Exemplo 5.5.1: Suponha que X e Y tm densidade valendo 1 no intervalo [0,1] e que so
independentes. Encontrar a densidade de S = X + Y .
Soluo: Do problema sabe-se que
f
X
(x) = 1, 0 x 1
e
f
Y
(y) = 1, 0 y 1.
Seja S = X + Y . Logo,
f
S
(s) =
_
f
X
(x)f
Y
(s x)dx, 0 x 1, 0 y 1.
Como 0 x 1 e 0 y 1 ento
0 x 1 0 s x 1.
A Figura H ilustra as situaes possveis para s.
tem gura aqui. Figura H da prova
(a) s 1 0 0 s 1 0 s 1.
(b) 0 < s 1 < 1 s 1 0 < s 2 s 1 1 s 2.
Em (a) tem-se que 0 x s e em (b), s 1 x 1.
Logo,
f
S
(s) =
_
s
0
dx = s, 0 s 1,
f
S
(s) =
_
1
s1
dx = 2 s, 1 s 2.
Concluindo,
f
S
(s) =
_
_
_
s, 0 s 1,
2 s, 1 s 2,
0, quaisquer outros valores.
Exemplo 5.5.2: Sejam X e Y com densidade conjunta dada por
f(x, y) = exp
(x+y)
, x 0, y 0.
Encontre a densidade de V = X + Y .
Soluo:
Exemplo 5.5.3: Se as variveis aleatrias X
1
e X
2
so independentes e identicamente
distribudas com a densidade
f(t) =
_
te
t
, t 0,
0, t < 0,
encontre a densidade de S = X
1
+ X
2
.
Soluo:
Campos & Rgo
5.5. FUNES DE VETORES ALEATRIOS 100
5.5.2 Distribuio de Z = XY
Seja Z = XY , isto , H(X, Y ) = XY . Fixando z, ento
B
z
= {(x, y) : xy z}.
Se
x > 0, xy z y
z
x
,
x < 0, xy z y
z
x
.
Logo,
B
z
= {(x, y) : < x < 0 y
z
x
} {(x, y) : 0 < x < + y
z
x
} = B
1
B
2
.
tem 2 guras aqui Figuras B
Ento
F
Z
(z) =
_ _
Bz
f(x, y)dxdy
=
_
0

(
_
+
z
x
f(x, y)dy)dx +
_
+
0
(
_ z
x

f(x, y)dy)dx.
Fazendo uma mudana de varivel na integral interna:
y =
v
x
dy =
1
x
dv.
Substituindo o valor de y em B
1
e B
2
,
v
x

z
x
v z z v < +,
v
x

z
x
v z < v z.
Logo,
F
Z
(z) =
_
0

(
_

z
f(x,
v
x
)
1
x
dv)dx +
_
+
0
(
_
z

f(x,
v
x
)
1
x
dv)dx
=
_
0

(
_
z

(
1
x
)f(x,
v
x
)dv)dx +
_
0

(
_
z

1
x
f(x,
v
x
)dv)dx
=
_
+

(
_
z

|
1
x
| f(x,
v
x
)dx)dv
=
_
z

(
_
+

|
1
x
| f(x,
v
x
)dx)dv.
Campos & Rgo
5.5. FUNES DE VETORES ALEATRIOS 101
Portanto,
f
XY
(z) =
_
+

|
1
x
| f(x,
z
x
)dx, < z < +. (5.9)
Se X e Y forem independentes, de 5.9 tem-se
f
XY
(z) =
_
+

|
1
x
| f
X
(x)f
Y
(
z
x
)dx, < z < +.
Se X e Y forem independentes e no-negativas,
f
XY
(z) =
_
+
0
1
x
f
X
(x)f
Y
(
z
x
)dx, z > 0.
Exemplo 5.5.4: Seja f(x, y) = 1, 0 x 1, 0 y 1. Determinar a densidade de
Z = XY .
Soluo:
5.5.3 Distribuio de Z =
Y
X
Seja Z =
Y
X
e z xo. Logo
B
z
= {(x, y) :
y
x
z}.
Se,
x > 0,
y
x
z y xz,
x < 0,
y
x
z y xz.
Portanto,
B
z
= {(x, y) : < x < 0 y xz} {(x, y) : 0 < x < + y xz}
= B
1
B
2
.
tem 2 guras aqui Figura C
Ento,
F
z
(z) =
_ _
Bz
f(x, y)dxdy
=
_
0

(
_
+
xz
f(x, y)dy)dx +
_
+
0
(
_
xz

f(x, y)dy)dx.
Fazendo uma mudana de variveis na integral mais interna e substituindo no valor de y
em B
z
tem-se:
Campos & Rgo
5.5. FUNES DE VETORES ALEATRIOS 102
y = xv dy = xdv
e
xv xz v z z v < +,
xv xz v z < v z.
Assim,
F
Z
(z) =
_
0

(
_

z
xf(x, xv)dv)dx +
_
+
0
(
_
z

xf(x, xv)dv)dx
=
_
0

(
_
z

(x)f(x, xv)dv)dx +
_
+
0
(
_
z

xf(x, xv)dv)dx
=
_
+

(
_
z

| x | f(x, xv)dv)dx
=
_
z

(
_
+

| x | f(x, xv)dx)dv
Logo,
fY
X
(z) =
_
+

| x | f(x, xz)dx, < z < +.


Se X e Y forem independentes,
fY
X
(z) =
_
+

| x | f
X
(x)f
Y
(xz)dx, < z < +.
Se X e Y forem independentes e no-negativas,
fY
X
(z) =
_
+
0
xf
X
(x)f
Y
(xz)dx, z > 0.
Exemplo 5.5.5: Sejam X e Y com densidade conjunta dada por
f(x, y) = exp
(x+y)
, x 0, y 0.
Encontre a densidade de U = X/Y .
Soluo:
Exemplo 5.5.6: Duas pessoas marcam um encontro em determinado lugar entre 12:00
e 13:00. Cada uma chega, na hora marcada, ao encontro independentemente e com uma
densidade constante. Ficou acertado entre ambas que nenhuma delas esperar mais do que
15 minutos pela outra. Determinar a probabilidade de se encontrarem.
Soluo: Este problema ser resolvido de trs formas distintas. A gura a seguir ilustra a
regio de encontro, E, de ambas.
tem gura aqui Figura D
Campos & Rgo
5.5. FUNES DE VETORES ALEATRIOS 103
1. Usando probabilidade geomtrica.
O quadrado de vrtices (0,0), (0,1), (1,0) e (1,1) tem lado 1, consequentemente rea
S = 1. A regio do encontro tem rea 1 (
3
4
)
2
=
7
16
. Logo, a probabilidade de que
ambas se encontrem
7
16
.
2. Usando densidade conjunta.
Sejam X e Y , respectivamente, os tempos de chegadas das duas pessoas. De acordo
com os dados do problema, como entre 12:00 e 13:00 tem-se uma hora,
X U(0, 1)
e
Y U(0, 1).
Como X e Y so independentes,
f(x, y) = f
X
(x)f
Y
(y) =
_
1, 0 < x < 1, 0 < y < 1,
0, quaisquer outros valores.
tem gura aqui Figura E
A probabilidade de se encontrarem em E dada por:
P(E) =
_ _
E
f(x, y)dxdy
=
_ _
R
1
f(x, y)dxdy +
_ _
R
2
f(x, y)dxdy +
_ _
R
3
f(x, y)dxdy.
Portanto,
_ _
R
1
f(x, y)dxdy =
_ 1
4
0
(
_
x+
1
4
0
dy)dx =
3
32
,
_ _
R
2
f(x, y)dxdy =
_ 3
4
1
4
(
_
x+
1
4
x
1
4
dy)dx =
4
16
,
_ _
R
1
f(x, y)dxdy =
_
1
3
4
(
_
1
x
1
4
dy)dx =
3
32
.
Logo,
P(E) =
3
32
+
4
16
+
3
32
=
7
16
.
Campos & Rgo
5.5. FUNES DE VETORES ALEATRIOS 104
3. Usando funo de vetor aleatrio.
Como visto anteriormente no exemplo 5.5.1, a densidade de S = X + Y , quando
X U(0, 1) e Y U(0, 1) f
S
(s) =
_
+

f
X
(x)f
Y
(s x)dx. O problema proposto
consiste em calcular
P(| X Y |
1
4
),
assim, a distribuio de interesse em
Z = X Y.
Por simetria, fcil supor que
f
Z
(z) =
_
f
X
(x)f
Y
(x z)dx
pois z = x y y = x z.
De acordo com os dados do problema, o integrando ser no nulo quando
0 x 1 0 x z 1. (5.10)
De 5.10 tem-se que
0 x 1 z x z + 1 (5.11)
A partir de 5.11 tem-se as seguintes situaes:
tem gura aqui Figura F
(a) z 0 0 z + 1 1 z 0 1 z 0 1 z 0.
(b) 0 z 1 z + 1 0 z 1 z 0 0 z 1.
Em (a) x toma valores entre 0 e z + 1; em (b) x varia de z a 1. Logo,
f
Z
(z) =
_
z+1
0
1dx = 1 +z, 1 z 0,
f
Z
(z) =
_
1
z
1dx = 1 z, 0 z 1.
Portanto,
f
Z
(z) =
_
_
_
1 +z, 1 z 0,
1 z, 0 < z 1,
0, quaisquer outros valores.
Campos & Rgo
5.5. FUNES DE VETORES ALEATRIOS 105
fcil ver
_
1
1
f
Z
(z)dz = 1. A probabilidade pedida :
P(| X Y |
1
4
) = P(
1
4
Z
1
4
)
=
_
0

1
4
(1 +z)dz +
_ 1
4
0
(1 z)dz
=
7
16
.
5.5.4 Jacobiano de uma Funo
Os resultados vistos anteriormente sobre a distribuio da soma, produto e quociente de
variveis aleatrias tambm poderiam ter sido obtidos via Jacobiano de uma funo, como
a seguir.
Dado um conjunto de n equaes em n variveis x
1
, . . . , x
n
,
y
1
= f
1
(x
1
, ..., x
n
), . . . , y
n
= f
n
(x
1
, ..., x
n
),
a matriz Jacobiana denida por
J =
_
_
_
y
1
x
1

y
1
xn
.
.
.
.
.
.
.
.
.
yn
x
1

yn
xn
_
_
_
O determinante de J chamado de Jacobiano. Pode-se provar que o mdulo do Jacobiano
d a razo entre volumes n-dimensionais em y e x quando a maior dimenso x
i
tende a
zero. Deste modo, o mdulo do Jacobiano aparece nas mudanas de varives de integrao
em integrais mltiplas, ou seja, existe um teorema do clculo REFER que arma que se
f : G
0
G for uma bijeo entre G
0
e G, f e as derivadas parcias que aparecem na matriz
Jacobiana forem funes contnuas em G
0
, e o Jacobiano for diferente de zero para todo
x G
0
_

_
A
g(y
1
, . . . , y
n
)dy
1
dy
n
=
_

_
f
1
(A)
g(f
1
(x
1
, ..., x
n
), . . . , f
n
(x
1
, ..., x
n
))|J|dx
1
dx
n
,
para qualquer funo g integrvel em A G.
O conceito de Jacobiano ser usado para resolver o seguinte exemplo da soma de duas
variveis aleatrias.
Exemplo 5.5.7: Suponha que (X, Y ) tenha densidade conjunta f(x, y) e seja Z = X +Y .
Neste caso,
F
Z
(z) = P(Z z) = P(X + Y z) = P((X, Y ) B
z
),
onde B
z
= {(x, y) : x + y z}. Portanto,
F
Z
(z) =
_

_
zy

f(x, y)dxdy.
Campos & Rgo
5.6. APRENDENDO UM POUCO MAIS... 106
Fazendo a mudana de variveis s = x + y, t = y, que tem jacobiano igual a 1, tem-se
F
Z
(z) =
_

_
z

f(s t, t)dsdt =
_
z

f(s t, t)dtds.
Logo,
_

f(s t, t)dt a densidade da soma Z = X + Y , ou seja,


f
Z
(z) =
_

f(z t, t)dt =
_

f(s, z s)ds,
onde foi feita a troca de variveis s = z t para obter a ltima expresso.
5.6 Aprendendo um pouco mais...
O mtodo do Jacobiano descrito a seguir para funes mais gerais H.
Suponha que G
0
IR
n
, G IR
n
sejam regies abertas, e que H : G
0
G seja uma
bijeo entre G
0
e G. Logo, existe a funo inversa H
1
em G, de modo que

X = H
1
(

Y ).
Suponha ainda que f a densidade conjunta de

X e que P(

X G
0
) = 1. Se as derivadas
parciais de H
1
existirem e o Jacobiano J de H
1
for diferente de zero para todo y G,
utiliza-se o teorema da mudana de variveis e obter que para B G, B Boreliano, tem-se
P(

Y B) = P(

X H
1
(B)) =
_

_
H
1
(B)
f(x
1
, . . . , x
n
)dx
1
dx
n
=
_

_
B
f(H
1
1
(y
1
, . . . , y
n
), . . . , H
1
n
(y
1
, . . . , y
n
))|J|dy
1
dy
n
.
Como P(

Y G) = P(

X H
1
(G)) = P(

X G
0
) = 1, ento, para todo Boreliano B
no IR
n
,
P(

Y B) = P(

Y BG) =
_

_
BG
f(H
1
1
(y
1
, . . . , y
n
), . . . , H
1
n
(y
1
, . . . , y
n
))|J|dy
1
dy
n
.
Esta ltima integral igual a integral sobre o conjunto B da funo que toma o valor
f(H
1
1
(y
1
, . . . , y
n
), . . . , H
1
n
(y
1
, . . . , y
n
))|J| para y G, e zero no caso contrrio. Portanto,
pela denio de densidade,
f

Y
(y
1
, . . . , y
n
) =
_
f(H
1
1
(y
1
, . . . , y
n
), . . . , H
1
n
(y
1
, . . . , y
n
))|J|, se y G,
0, caso contrrio.
Observaes
(i) Note que J o Jacobiano da funo inversa H
1
. Em alguns casos pode ser til obter
J a partir do Jacobiano J

da funo H atravs da relao J =


1
J

|
x=H
1
( y)
.
Campos & Rgo
5.6. APRENDENDO UM POUCO MAIS... 107
(ii) Para obter a distribuio de

Y = H(

X) quando a dimenso de

Y menor que a
dimenso de

X muitas vezes possvel denir outras variveis aleatrias Y

1
, . . . , Y

m
,
utilizar o mtodo do Jacobiano para determinar a densidade conjunta de

Y , Y

1
, . . . , Y

m
e, nalmente, obter a densidade marginal conjunta de

Y . Considere o seguinte exemplo:
Exemplo 5.6.1: Suponha que X
1
, X
2
tem densidade conjunta dada por f(x, y) e que
o objetivo seja a distribuio de Y
1
= X
2
1
+ X
2
. Como esta no uma transformao
1-1, ela no possui inversa. Denindo uma nova varivel Y
2
= X
1
de modo que a
funo (Y
1
, Y
2
) = H(X
1
, X
2
) = (X
2
1
+X
2
, X
1
) possua uma funo inversa diferencivel,
(X
1
, X
2
) = H
1
(Y
1
, Y
2
) = (Y
2
, Y
1
Y
2
2
). Deste modo,
J = det
_
x
1
y
1
x
1
y
2
x
2
y
1
x
2
y
2
_
=
_
0 1
1 2y
2
_
= 1
Ento, f
Y
1
,Y
2
(y
1
, y
2
) = f(y
2
, y
1
y
2
2
). Finalmente, para encontrar f
Y
1
integra-se sobre
todos os possveis valores da varivel Y
2
introduzida:
f
Y
1
(y
1
) =
_

f(y
2
, y
1
y
2
2
)dy
2
.
(iii) Pode-se utilizar o mtodo do Jacobiano em outros casos em que a funo H no
1-1. Para tanto, suponha que G, G
1
, . . . , G
k
sejam subregies abertas do IR
n
tais que
G
1
, . . . , G
k
sejam disjuntas e P(

X
k
i=1
G
i
) = 1, tais que a funo H|
G
l
, a restrio
de H a G
l
, seja um correspondncia 1-1 entre G
l
e G, para l = 1, . . . , k. Suponha que
para todo l, a funo inversa de H|
G
l
satisfa as hipteses do caso anterior, e seja J
l
o
Jacobiano da inversa de H|
G
l
. Pode-se provar que
f

Y
(y
1
, . . . , y
n
) =
_
k
l=1
f(H|
1
G
l
(y
1
, . . . , y
n
))|J
l
|, se y G,
0, caso contrrio.
Para a utilizao do mtodo do jacobiano, foi necessrio assumir que o vetor

X possua
densidade conjunta. Na prxima seo ser visto como estender este mtodo para um caso
mais geral.
5.6.1 Extenso do Mtodo Jacobiano para o Clculo de Densidades
de Funes de Vetores Aleatrios Quaisquer
A extenso supe apenas que existe pelo menos uma varivel no vetor

X que absolutamente
contnua dado os valores das demais variveis em

X.
Para um dado vetor z IR
m
, sejam G
0
e G
z
regies abertas do IR
n
, e g : G
0
{z}
G
z
{z} uma funo bijetiva. Seja f

X|

Z
a densidade condicional conjunta do vetor aleatrio

X = (X
1
, . . . , X
n
) dado o vetor aleatrio

Z = (Z
1
, . . . , Z
m
), onde P((X
1
, . . . , X
n
) G
0
|

Z =
Campos & Rgo
5.6. APRENDENDO UM POUCO MAIS... 108
z) = 1. No assume-se qualquer hiptese sobre o tipo do vetor

Z, o qual pode ter partes
discreta, contnua ou singular diferentes de zero.
Sejam Y
1
, . . . , Y
n
variveis obtidas a partir de funes dos vetores

X e

Y , i.e., Y
i
=
g
i
(X
1
, . . . , X
n
, Z
1
, . . . , Z
m
), i = 1, 2, . . . , n. Portanto, existe funo inversa h = g
1
denida
em G
z
{z}, onde
X
1
= h
1
(Y
1
, . . . , Y
n
, z
1
, . . . , z
m
), . . . , X
n
= h
n
(Y
1
, . . . , Y
n
, z
1
, . . . , z
m
),
e h
i
(Y
1
, . . . , Y
n
, z
1
, . . . , z
m
) = z
i
, para i {n + 1, n + 2, . . . , n + m}.
Suponha que existam as derivadas parciais
X
i
Y
j
=
h
i
(Y
1
, . . . , Y
n
, z
1
, . . . , z
m
)
Y
j
,
para i, j {1, . . . , n} e que elas sejam contnuas em G
z
{z}. Dene-se o jacobiano
condicional dado

Z = z como J(

X,

Y |

Z = z) pelo determinante:
J(

X,

Y |

Z = z) = det
_
_
_
X
1
Y
1

X
i
Yn
.
.
.
.
.
.
Xn
Y
1

Xn
Yn
_
_
_
Suponha que J(

X,

Y |

Z = z) seja diferente de zero para todo



Y G
z
. Ento para B
G
z
, B boreliano, seja h(B{z}) = {(x
1
, . . . , x
n
) : para algum y B, x
i
= h
i
(y, z) para todo i =
1, . . . , n}. Utilizando o teorema de mudana de variveis, tem-se
P(

Y B|

Z = z) = P(

X h(B {z})|

Z = z)
=
_

_
h(B{z})
f

X|

Z
(x
1
, . . . , x
n
|z)dx
1
dx
n
=
_

_
B
f

X|

Z
(h
1
(y, z), . . . , h
n
(y, z)|z)|J(x, y|

Z = z)|dy
1
dy
n
.
Como P(

Y G
z
|

Z = z) = P(

X h(G
z
{z})|

Z = z) = P(

X G
0
|

Z = z) = 1, tem-se
que para todo boreliano B no IR
n
,
P(

Y B|

Z = z) = P(

Y B G
z
|

Z = z)
=
_

_
BG
z
f

X|

Z
(h
1
(y, z), . . . , h
(
n
y, z)|z)|J(x, y|

Z = z)|dy
1
dy
n
.
Esta ltima integral igual a integral sobre o conjunto B da funo que toma o valor
f

X|

Z
(h
1
(y, z), . . . , h
n
(y, z)|z)|J(x, y|

Z = z)| para y G
z
, e zero, caso contrrio. Portanto,
pela denio de densidade condicional:
Campos & Rgo
5.6. APRENDENDO UM POUCO MAIS... 109
f

Y |

Z
(y
1
, . . . , y
n
|z)
=
_
f

X|

Z
(h
1
(y, z), . . . , h
n
(y, z)|z)|J(x, y|

Z = z)|, se y G
z
,
0, caso contrrio.
A m de se obter a densidade incondicional do vetor

Y , calcula-se a esperana
2
da
densidade condicional f

Y |

Z
com respeito a distribuio do vetor aleatrio

Z. Portanto,
f

Y
(y) =
_
f

Y |

Z
(y
1
, . . . , y
n
|z)dF

Z
(z).
No caso particular em que

Z for um vetor aleatrio com densidade conjunta f

Z
,
f

Y
(y) =
_

_
f

Y |

Z
(y
1
, . . . , y
n
|z)f

Z
(z)dz
1
dz
m
,
e, no caso particular em que

Z for um vetor aleatrio discreto com funo probabilidade
de massa conjunta p

Z
,
f

Y
(y) =

z
f

Y |

Z
(y
1
, . . . , y
n
|z)p

Z
(z).
Exemplo 5.6.2: Suponha que X
1
uma varivel aleatria discreta que assume os valores
10, 15, 20 com probabilidades 1/4, 1/2, e 1/4, respectivamente. Sejam ainda X
2
e X
3
variveis
aleatrias que so condicionalmente independentes dado X
1
e com distribuies condicionais
X
2
|X
1
= k Exp(k) e X
3
|X
1
= k Exp(2k). Seja Y = X
2
1
+ X
2
2
+ X
2
3
e Z = arctg(
X
2
X
3
).
Determinar a densidade conjunta de (Y, Z).
Soluo: A densidade condicional conjunta de (X
2
, X
3
)|X
1
= k dada por
2k
2
e
kx
2
2kx
3
U(x
2
)U(x
3
). Tem-se que X
1
= k, P((Y, Z) [k
2
, ) [0, /2]) = 1, X
2
=
(Y k
2
)senZ e X
3
= (Y k
2
) cos Z. Portanto, o Jacobiano condicional dado que X
1
= k
dado por:
J((X
2
, X
3
), (Y, Z)|X
1
= k) = det
_
senZ (Y k
2
) cos Z
cos Z (Y k
2
)senZ
_
= (Y k
2
).
Assim, a densidade condicional de (Y, Z) dado que X
1
= k dada por:
f
Y,Z|X
1
(y, z|k)
=
_
f
X
2
,X
3
|X
1
((y k
2
)senz, (y k
2
) cos z|k)(y k
2
), se (y, z) [k
2
, ) [0, /2),
0, caso contrrio.
=
_
2k
2
e
k(yk
2
)(senz+2 cos z)
, se (y, z) [k
2
, ) [0, /2),
0, caso contrrio.
2
este coneito ser dado no prximo captulo, mas nesta seo ...
Campos & Rgo
5.6. APRENDENDO UM POUCO MAIS... 110
Calculando a esperana em termos da distribuio de X
1
, tem-se:
f
Y,Z
(y, z) = P(X
1
= 10)f
Y,Z|X
1
(y, z|10)
+P(X
1
= 15)f
Y,Z|X
1
(y, z|15) +P(X
1
= 20)f
Y,Z|X
1
(y, z|20),
ou seja,
f
Y,Z
(y, z)
=
_

_
1
4
(200e
10(y100)(senz+2 cos z)
), se (y, z) [100, 225) [0, /2),
1
4
(200e
10(y100)(senz+2 cos z)
)+
+
1
2
(450e
15(y225)(senz+2 cos z)
), se (y, z) [225, 400) [0, /2),
1
4
(200e
10(y100)(senz+2 cos z)
) +
1
2
(450e
15(y225)(senz+2 cos z)
)+
+
1
4
(800e
20(y400)(senz+2 cos z)
), se (y, z) [400, ) [0, /2),
0, caso contrrio.
Observaes:
(i) No desenvolvimento na seo anterior, para obter a distribuio de

Y = g(

X,

Z) assumiu-
se que o vetor

Y tem dimenso igual a dimenso do vetor

X. Quando a dimenso de

Y
menor que a dimenso de

X, o tratamento anlogo ao caso da utilizao do mtodo
do Jacobiano para vetores absolutamente contnuos, ou seja, muitas vezes possvel
denir outras variveis aleatrias auxiliares Y

1
, . . . , Y

m
, utilizar a extenso do mtodo
do Jacobiano para determinar a densidade condicional conjunta de

Y , Y

1
, . . . , Y

m
dado

Z e, nalmente, obter a densidade marginal condicional conjunta de



Y dado

Z.
(ii) Tambm pode-se utilizar o mtodo do Jacobiano em outros casos em que a funo g no
bijetiva. Para tanto, dado que

Z = z, suponha que G
z
, G
z
1
, . . . , G
z
k
sejam subregies
abertas do IR
n
tais que G
z
1
, . . . , G
z
k
sejam disjuntas e P((

Z) (
k
i=1
G
z
i
) {z}) = 1,
tais que a funo g|
G
z
l
, a restrio de g a G
z
l
seja bijetiva entre G
z
l
e G
z
, para l = 1, . . . , k.
Suponha que para todo l, a funo inversa de g|
G
z
l
satisfaa as hipteses do caso
anterior, e seja J
z
l
o Jacobiano condicional dado que

Z = z da inversa de g|
G
z
l
. Pode-se
provar que
f

Y |

Z
(y
1
, . . . , y
n
|z) =
_

k
l=1
f

X|

Z
(g|
1
G
z
l
(y
1
, . . . , y
n
, z)|z)|J
z
l
|, se y G
z
,
0, caso contrrio.
5.6.2 Exerccios
1. Suponha que X seja uma varivel aleatria contnua com funo densidade de proba-
bilidade
f(x) =
_
e
x
, x > 0
0, x 0.
Para b > 0 real, determine:
Campos & Rgo
5.6. APRENDENDO UM POUCO MAIS... 111
(a) F(x | 0 < X < b) = P(X x | 0 < X < b), para todo x real.
(b) f(x | 0 < X < b), a funo densidade condicional de X, dado que X (0, b).
2. Um assoalho feito de quadrados de lado l. Joga-se uma agulha de comprimento
a < l. Determine a probabilidade de que a agulha intercepte dois lados adjacentes de
um quadrado desse assoalho. (proposto por Francisco de Assis L. Filho)
3. Sejam = {
1
,
2
,
3
} e P(
1
) = P(
2
) = P(
3
) = 1/3. Denindo X, Y e Z como se
segue:
X(
1
) = 1, X(
2
) = 2, X(
3
) = 3,
Y (
1
) = 2, Y (
2
) = 3, Y (
3
) = 1,
Z(
1
) = 3, Z(
2
) = 1, Z(
3
) = 2,
mostre que estas trs variveis aleatrias tm a mesma distribuio de probabilidade.
Encontre a distribuio de probabilidade de X + Y , Y + Z e X + Z.
4. Suponha que X uma varivel aleatria assumindo os valores 3, 1, 0, 1, 2, 3, 5, 8
com as respectivas probabilidades 0.1, 0.2, 0.15, 0.2, 0.1, 0.15, 0.05, 0.05. Determine
as probabilidades de:
(a) X ser negativa.
(b) P(X = 3 | X 0).
(c) P(X 3 | X > 0).
5. Considere a varivel aleatria bidimensional (X, Y ) uniformemente distribuda na re-
gio poligonal T de vrtices (-2,0), (2,0), (1,1) e (-1,1).
(a) Determine a funo de densidade de probabilidade conjunta f(x, y).
(b) Determine a funo de densidade de probabilidade marginal f
X
(x).
(b) Determine a funo de densidade de probabilidade marginal f
Y
(y).
(d) Verique se X e Y so variveis aleatrias independentes.
6. Considere duas variveis aleatrias X e Y com distribuio de probabilidade conjunta
uniforme na regio triangular tendo vrtices nos pontos (0,0), (0,1) e (1,0).
(a) Escreva a expresso da densidade conjunta.
(b) Determine as densidades marginais.
(c) X e Y so independentes?
7. Duas mensagens que esto sendo transmitidas, independentemente uma da outra, po-
dem ser distorcidas ou no. A probabilidade do evento A = {uma mensagem distorcida}
para a primeira mensagem p
1
e para a segunda p
2
. Seja um sistema de variveis ale-
atrias (X, Y ) denido como se segue:
Campos & Rgo
5.6. APRENDENDO UM POUCO MAIS... 112
X =
_
1, se a primeira mensagem distorcida,
0, se a primeira mensagem no distorcida.
Y =
_
1, se a segunda mensagem distorcida,
0, se a segunda mensagem no distorcida.
(X e Y so os indicadores do evento A).
(a) Encontre a distribuio de probabilidade conjunta do par de variveis aleatrias
(X, Y ).
(b) Encontre a funo distribuio de probabilidade acumulada F(x, y).
8. Sejam duas variveis aleatrias independentes X e Y , cada uma das quais com distri-
buio exponencial com diferentes parmetros. Escreva expresses para
(a) a funo densidade conjunta f(x, y) e
(b) a funo distribuio conjunta F(x, y).
9. Um sistema de variveis aleatrias (X, Y ) tem funo densidade conjunta f(x, y). Ex-
presse as seguintes probabilidades em termos de f(x, y):
(a) {X > Y };
(b) {X >| Y |};
(c) {| X |> Y };
(d) {X Y > 1}.
10. Um sistema de variveis aleatrias (X, Y, Z) tem uma densidade conjunta f(x, y, z).
Escreva expresses para:
(a) as densidades f
X
(x), f
Y
(y)
(b) a densidade conjunta f
Y,Z
(y, z) do vetor aleatrio (X, Z);
(c) a densidade condicional f
Y,Z
(y, z | x);
(d) a densidade condicional f
Y
(y | x, z);
(e) a funo de distribuio conjunta F(x, y, z);
(f) a funo de distribuio F
X
(x) da varivel aleatria X;
(g) a funo de distribuio F(x, y) do vetor (X, Y ).
11. Um sistema de variveis aleatrias (X, Y, Z) se distribui com uma densidade constante
no interior de uma bola de raio r. Encontre a probabilidade de que o ponto aleatrio
(X, Y, Z) caia numa bola concntrica de raio r/2.
Campos & Rgo
5.6. APRENDENDO UM POUCO MAIS... 113
12. Seja o vetor aleatrio (X, Y ). Sabe-se que a varivel aleatria X segue uma distribuio
exponencial com parmetro . Para um dado X = x > 0, a varivel aleatria Y
tambm segue uma distribuio exponencial com parmetro x.
(a) Escreva a densidade conjunta f(x, y) de X e Y .
(b) Encontre a densidade de Y .
(c) Encontre a densidade condicional f
X|Y
(x | y).
13. Duas pessoas marcam um encontro em um determinado lugar, entre 12:00 e 13:00
horas. Cada uma chega ao local do encontro independentemente e com uma densidade
de probabilidade constante no intervalo de tempo assinalado. Encontre a probabilidade
de que a primeira pessoa espere no menos que meia hora.
14. Dadas duas variveis aleatrias X e Y com uma densidade conjunta f(x, y), determine:
(a) a funo densidade do mximo das duas variveis, Z = max{X, Y };
(b) a funo densidade do mnimo das duas variveis, Z = min{X, Y };
(c) a funo densidade do mximo o do mnimo de vrias variveis aleatrias.
15. Sejam X e Y variveis aleatrias discretas e sejam g e h funes tais que satisfaam a
identidade P(X = x, Y = y) = g(x)h(y).
(a) Expresse P(X = x) em termos de g e h.
(b) Expresse P(Y = y) em termos de g e h.
(c) Mostre que (

x
g(x))(

y
h(y)) = 1.
(d) Mostre que X e Y so independentes.
16. Sejam X
1
e X
2
duas determinaes independentes da varivel aleatria X. Encontre
a densidade da varivel aleatria Z = X
1
/X
2
.
17. Suponha que as dimenses X e Y de uma chapa retangular de metal possam ser consi-
deradas variveis aleatrias contnuas independentes com densidades, respectivamente:
f
X
(x) =
_
_
_
x 1, 1 < x 2,
x + 3, 2 < x < 3,
0, quaisquer outros casos.
f
Y
(y) =
_
1/2, 2 < y < 4,
0, quaisquer outros casos.
Encontre a densidade da rea da chapa, A = XY .
18. Ao mensurar-se T, a durao da vida de uma pea, pode-se cometer um erro, o qual
se pode admitir ser uniformemente distribudo sobre (-0.01,0.01). Por isso, o tempo
registrado (em horas) pode ser representado por T + X, onde T, tem uma distribui-
o exponencial com parmetro 0.2 e X tem a distribuio uniforme descrita acima.
Determine a densidade de T + X, quando T e X forem independentes.
Campos & Rgo
5.6. APRENDENDO UM POUCO MAIS... 114
19. Sejam T
1
e T
2
variveis aleatrias independentes com distribuio exponencial de pa-
rmetros
1
e
2
, respectivamente. Encontre a densidade de M = max{T
1
, T
2
} e de
K = min{T
1
, T
2
}.
20. As variveis aleatrias X
i
, i = 1, , n so mutuamente independentes e seguem uma
lei de Poisson com parmetros
i
. Mostre que sua soma tambm segue uma distribuio
de Poisson, onde o parmetro a soma dos parmetros.
21. Sejam X
1
e X
2
amostras aleatrias de uma distribuio uniforme no intervalo (1,10).
Encontre a densidade de Y = X
1
X
2
. Mostre que P(Y A) >
1
9
onde A = {y | 1 <
y < 2} {y | 10 < y < 20}.
Campos & Rgo
Captulo 6
Esperana e outros Momentos
6.1 O Conceito de Esperana
O conceito de esperana ou valor esperado de uma varivel aleatria X, ou a mdia
to antigo quanto o prprio conceito de probabilidade. Na verdade, at possvel denir
probabilidade em termos de esperana, mas esta no uma maneira comum de se apresentar
a teoria. As seguintes podem ser interpretaes da esperana:
(a) Parmetro m de uma medida de probabilidade, funo de distribuio, ou funo pro-
babilidade de massa, tambm conhecido como mdia.
(b) Operador linear em um conjunto de variveis aleatrias que retorna um valor tpico da
varivel aleatria interpretado como uma medida de localizao da varivel aleatria.
(c) Mdia do resultado de repetidos experimentos independentes no longo prazo.
(d) Preo justo de um jogo com pagamentos descritos por X.
6.2 Denio da Esperana
A denio de esperana pode ser motivada considerando o clculo do resultado mdio de
1000 lanamentos de um dado. Uma maneira de calcular este resultado mdio seria somar
todos os resultados e dividir por 1000. Uma maneira alternativa seria calcular a frao p(k),
k = 1, . . . , 6 de todos os lanamentos que tiveram resultado igual a k e calcular o resultado
mdio atravs da soma ponderada:
1p(1) + 2p(2) + 3p(3) + 4p(4) + 5p(5) + 6p(6).
Quando o nmero de lanamentos torna-se grande as fraes de ocorrncia dos resultados
tendem probabilidade de cada resultado.
Em geral, dene-se a esperana de uma varivel discreta como uma soma ponderada onde
as probabilidades so os pesos de ponderao.
115
6.3. ESPERANA DE FUNES DE VARIVEIS ALEATRIAS 116
Denio 6.2.1: Se X uma varivel aleatria discreta com valores {x
1
, x
2
, x
3
, . . .} e
probabilidades {p
1
, p
2
, p
3
, . . .}, respectivamente, ento sua esperana ,
E(X) =

i
x
i
p
i
,
desde que

i
| x
i
| p
i
< . Como p
i
= P(X = x
i
), ento
E(X) =

i
x
i
P(X = x
i
).
Exemplo 6.2.2: Considere uma varivel aleatria X tal que: P(X = 1) = 0.25, P(X =
0) = 0.5 e P(X = 2) = 0.25. Ento,
E(X) = 1(0.25) + 0(0.5) + 2(0.25) = 0.25.
Exemplo 6.2.3: Seja uma varivel aleatria X tal que: P(X = a) = P(X = a) = 1/2.
Ento,
E(X) = a(0.5) +a(0.5) = 0.
Note ento que muitas variveis aleatrias diferentes podem ter o mesmo valor esperado
ou esperana. ( s variar o valor de a no exemplo anterior.)
Exemplo 6.2.4: Aleatria. Se X {1, 2, . . . , n} for uma varivel aleatria com distri-
buio de probabilidade aleatria com parmetro n, sua esperana dada por:
E(X) =
n

k=1
kp(k) =
n

k
k
1
n
=
1
n
n

k
k =
1
n
n(n + 1)
2
=
n + 1
2
.
Denio 6.2.5: Se X uma varivel aleatria contnua com densidade f
X
(x) ento,
E(X) =
_
+

xf
X
(x)dx
se
_
+

| x | f
X
(x)dx < .
Exemplo 6.2.6: Se f
X
(x) =
1
2
, 2 < x < 4, ento
E(X) =
_
4
2
x
1
2
dx = 3.
6.3 Esperana de Funes de Variveis Aleatrias
Se X for uma varivel aleatria e se Y = H(X), ento Y tambm ser uma varivel aleatria.
Consequentemente, pode-se calcular E(Y ). Existem duas maneiras equivalentes de calcular
E(Y ), quer a varivel seja discreta, quer seja contnua: (i) primeiro, encontrar a lei de
probabilidade da varivel Y = H(X) pelos mtodos j vistos anteriormente para, em seguida,
calcular a esperana da varivel Y ; (ii) calcular a esperana de Y diretamente usando a funo
H(X). Isto ser visto a seguir, inicialmente no caso discreto, a seguir, no contnuo.
Campos & Rgo
6.3. ESPERANA DE FUNES DE VARIVEIS ALEATRIAS 117
6.3.1 Caso Discreto
Denio 6.3.1: Seja X uma varivel aleatria discreta e seja Y = H(X). Se Y assumir
os seguintes valores y
1
, y
2
, . . . e se p(y
i
) = P(Y = y
i
), dene-se:
E(Y ) =

i=1
y
i
p(y
i
).
Exemplo 6.3.2:
Conforme visto no captulo anterior pode-se determinar as probabilidades p(y
i
) dado que
sabe-se a distribuio de X. No entanto, possvel encontrar E(Y ) sem, preliminarmente,
encontrar a distribuio de probabilidade de Y , partindo-se apenas do conhecimento da
distribuio de probabilidade de X, conforme mostra o seguinte teorema.
Teorema 6.3.3: Seja X uma varivel aleatria discreta assumindo os valores x
1
, x
2
, . . . e
seja Y = H(X). Se p(x
i
) = P(X = x
i
), ento
E(Y ) = E(H(X)) =

i=1
H(x
i
)p(x
i
).
Prova: Reordenando o somatrio

i=1
H(x
i
)p(x
i
), e agrupando os termos onde x
i
tem a
mesma imagem de acordo com a funo H, ou seja, sejam x
i1
, x
i2
, . . ., todos os valores x
i
tal
que H(x
ij
) = y
i
para j 1, onde y
1
, y
2
, . . . so os possveis valores de Y , tem-se,

i=1
H(x
i
)p(x
i
) =

i=1

j=1
H(x
ij
)p(x
ij
) =

i=1
y
i

j=1
p(x
ij
) =

i=1
y
i
p(y
i
) = E(Y ).
Exemplo 6.3.4:
Este resultado pode ser estendido para o caso de uma funo real de um vetor aleatrio.
Neste caso, se Y = H(

X), ento
E(Y ) =

i
H( x
i
)p

X
( x
i
),
em que os x
i
so os valores assumidos pelo vetor aleatrio

X.
Exemplo 6.3.5:
Campos & Rgo
6.4. PROPRIEDADES DA ESPERANA 118
6.3.2 Caso Contnuo
Denio 6.3.6: Seja X uma varivel aleatria contnua e Y = H(X). Ento,
E(Y ) =
_
+

yf
Y
(y)dy,
desde que
_
+

| y | f
Y
(y)dy < .
Exemplo 6.3.7:
A prova do teorema a seguir omitida desde que foge ao escopo do livro.
Teorema 6.3.8: Seja X uma varivel aleatria contnua, Y = H(X), ento
E(Y ) =
_
ydF
Y
(y) =
_
H(x)dF
X
(x),
desde que estas integrais existam.
Exemplo 6.3.9:
Uma frmula anloga tambm vlida quando funes de vetores aleatrios so consi-
derados..
Teorema 6.3.10: Seja

X um vetor aleatrio e Y = H(

X) uma varivel aleatria. Ento,


E(Y ) =
_
ydF
Y
(y) =
_
HdF

X
.
Exemplo 6.3.11:
6.4 Propriedades da Esperana
As seguintes propriedades so aplicaes imediatas da denio de esperana:
(i) P(X = c) = 1 E(X) = c.
(ii) P(X 0) = 1 E(X) 0.
(iii) E(aX) = aE(X), onde a um nmero real qualquer.
Esta propriedade segue facilmente da expresso da esperana de uma funo de varivel
aleatria.
Campos & Rgo
6.4. PROPRIEDADES DA ESPERANA 119
(iv) E(X + Y ) = E(X) + E(Y ).
No caso discreto,
E(X + Y ) =

j
(x
i
+ y
j
)p(x
i
, y
j
) =

i
x
i

j
p(x
i
, y
j
) +

j
y
j
p(x
i
, y
j
)
=

i
x
i
p(x
i
) +

j
y
j

i
p(x
i
, y
j
) = E(X) +

j
y
j
p(y
j
) = E(X) + E(Y ).
No caso geral contnuo,
E(X + Y ) = E((X, Y )) =
_ _
(x + y)dF
X,Y
(x, y),
e pela linearidade da integral,
E(X + Y ) =
_ _
xdF
X,Y
(x, y) +
_ _
ydF
X,Y
(x, y) = E(X) + E(Y ).
(v) E(

n
i
a
i
X
i
) =

n
i
a
i
E(X
i
).
Para provar esta propriedade basta usar as duas ltimas propriedades e induo ma-
temtica.
(vi) P(X Y ) = 1 E(X) E(Y ).
Esta segue das Propriedades (ii) e (v), pois
P(X Y ) = P(X Y 0),
o que, pela Propriedade (ii), implica que E(X Y ) 0. Pela Propriedade (v),
E(X Y ) = E(X) E(Y ), ou seja pode-se concluir que E(X) E(Y ) 0.
(vii) Se {X
1
, . . . , X
n
} so variveis aleatrias mutuamente independentes, ento
E(
n

i=1
X
i
) =
n

i=1
E(X
i
).
No caso discreto,
E(
n

i=1
X
i
) =

i
1
. . .

in
x
i
1
. . . x
in
p(x
i
1
, . . . , x
in
)
=

i
1
. . .

in
x
i
1
. . . x
in
n

j=1
p(x
i
j
)
=

i
1
x
i
1
p(x
i
1
) . . .

in
x
in
p(x
in
)
=
n

i=1
E(X
i
).
Campos & Rgo
6.5. MOMENTOS 120
No caso contnuo f

X
(x) =

n
i=1
f
X
i
(x
i
), logo
E(
n

i=1
X
i
) =
_

_
x
1
x
n
f

X
(x)dx
1
dx
n
=
_

_
n

i=1
x
i
f
X
i
(x
i
)dx
1
dx
n
=
n

i=1
_
x
i
f
X
i
(x
i
)dx
i
=
n

i=1
E(X
i
).
De maneira anloga, pode-se provar a seguinte generalizao deste resultado:
Se {X
1
, . . . , X
n
} so variveis aleatrias mutuamente independentes, ento
E(
n

i=1
G(X
i
)) =
n

i=1
E(G(X
i
)).
(viii) Se Y for uma varivel aleatria que assume valores inteiros no-negativos, ento
E(Y ) =

k=1
kP(Y = k) =

k=1
k

j=1
P(Y = k),
trocando a ordem dos somatrios:
E(Y ) =

j=1

k=j
P(Y = k) =

j=1
P(Y j).
6.5 Momentos
Momentos do informaes parciais sobre a medida de probabilidade P, a funo de distribui-
o acumulada, ou a funo probabilidade de massa de uma varivel aleatria X. Momentos
de X so esperanas de potncias de X.
Denio 6.5.1: Para qualquer inteiro no-negativo n, o n-simo momento da varivel
aleatria X
E(X
n
),
se esta esperana existe.
Este momento usualmente denominado de momento em torno do zero, uma vez que
poderia ser escrito como E((X 0)
n
).
Exemplo 6.5.2: Seja X tal que
P(X = k) =
_
n
k
_
p
k
(1 p)
nk
, k = 0, 1, . . . , n.
Campos & Rgo
6.5. MOMENTOS 121
Ento, o segundo momento de X, E(X
2
) :
E(X
2
) =
n

k=0
k
2
_
n
k
_
p
k
(1 p)
nk
=
n

k=1
k
2
n!
k!(n k)!
p
k
(1 p)
nk
=
n

k=1
k(k 1)
n!
k!(n k)!
p
k
(1 p)
nk
+
n

k=1
k
n!
k!(n k)!
p
k
(1 p)
nk
= n(n 1)p
2
n

k=2
(n 2)!
(k 2)!(n k)!
p
k2
(1 p)
nk
+ np
= n(n 1)p
2
m

j=0
(m)!
(j)!(mj)!
p
j
(1 p)
mj
+ np = n(n 1)p
2
+ np.
Teorema 6.5.3: Se o k-simo momento de uma varivel aleatria existir, ento todos os
momentos de ordem menores do que k tambm existem.
Prova: Por hiptese, E(|X
k
|) < , logo E(1 +|X
k
|) < . Como para qualquer j tal que
0 < j < k, |X
j
| 1 + |X
k
|, e 1 + |X
k
| integrvel, tem-se que |X
j
| tambm integrvel,
isto E(|X
j
|) < .
6.5.1 Momentos Centrais. Varincia
Denio 6.5.4: Se X uma varivel aleatria seu n-simo momento central em torno de
E(X)
E(X E(X))
n
,
se esta esperana existir.
O primeiro momento central em torno da mdia zero, pois
E(X E(X)) = E(X) E(E(X)) = E(X) E(X) = 0.
O segundo momento central conhecido como varincia e denota-se por V (X). A varincia
pode ser tambm calculada por:
V (X) = E(X E(X))
2
= E(X
2
2XE(X) + (E(X))
2
)
= E(X
2
) 2E(XE(X)) +E((E(X))
2
)
= E(X
2
) 2(E(X))
2
+ (E(X))
2
= E(X
2
) (E(X))
2
= E(X
2
) E(X)
2
.
Campos & Rgo
6.5. MOMENTOS 122
Exemplo 6.5.5:
Do Teorema Binomial e da linearidade da esperana, tem-se:
E(X E(X))
n
=
n

k=0
_
n
k
_
(E(X))
nk
E(X
k
)
e
E(X
n
) = E(X E(X) + E(X))
n
=
n

k=0
_
n
k
_
(E(X))
nk
E(X E(X))
k
.
Corolrio 6.5.6: O n-simo momento central existe se, e somente se, o n-simo momento
existe.
Exemplo 6.5.7: Considere uma varivel aleatria X tal que
P(X = ma) = P(X = m+ a) =
1
2
E(X
k
) =
1
2
[(ma)
k
+ (m+ a)
k
].
E(X) = m,
E(X
2
) =
1
2
(2m
2
+ 2a
2
) = m
2
+ a
2
,
V (X) = a
2
.
Este exemplo, mostra que possvel encontrar uma varivel aleatria possuindo qualquer
esperana e varincia predeterminadas.
Denio 6.5.8: O desvio-padro de uma varivel aleatria X denido como a raiz
quadrada positiva da varincia,
(X) =
_
V (X).
6.5.2 Propriedades da Varincia e de outros Momentos
(i) V (X) 0.
Prova: Pela denio de varincia.
(ii) Se X = c, V (X) = 0.
Prova: E(X) = c, logo V (X) = E(X c)
2
= E(0) = 0.
(iii) V (X + a) = V (X), onde a uma constante real.
Prova:
V (X + a) = E(X + a)
2
(E(X + a))
2
= E(X
2
) + 2aE(X) + a
2
(E(X))
2
2aE(X) a
2
= E(X
2
) (E(X))
2
= V (X).
Campos & Rgo
6.5. MOMENTOS 123
(iv) V (aX) = a
2
V (X)
Prova:
V (aX) = E(aX)
2
(E(aX))
2
= a
2
E(X)
2
a
2
(EX)
2
= a
2
V (X).
(v) Se X e Y forem variveis aleatrias mutuamente independentes, ento
V (X + Y ) = V (X) + V (Y ).
Prova:
V (X + Y ) = E(X + Y )
2
(E(X + Y ))
2
= E(X
2
+ 2XY + Y
2
) (E(X))
2
2E(X)E(Y ) (EY )
2
= E(X
2
) E(X)
2
+ E(Y
2
) E(Y )
2
+ 2(E(XY ) E(X)E(Y ))
= E(X
2
) + E(Y
2
) (E(X))
2
(E(Y ))
2
+ 2E(XY ) 2E(X)E(Y )
= V (X) + V (Y ).
porque E(XY ) = E(X)E(Y ).
(vi) Se X
1
, . . . , X
n
so variveis aleatrias independentes, ento
V (X
1
+ . . . X
n
) = V (X
1
) + . . . + V (X
n
).
Esta propriedade segue da propriedade anterior e da aplicao de induo matemtica.
(vii) Se X e Y so variveis aleatrias em (, A, P) tais que E(|X
t
|) < e E(|Y
t
|) < ,
ento E(|X + Y |
t
) < .
Prova: |X+Y | |X|+|Y | 2 max(|X|, |Y |). Portanto, |X+Y |
t
2
t
max(|X|
t
, |Y |
t
)
2
t
(|X|
t
+|Y |
t
). Logo, E(|X + Y |
t
) 2
t
(E(|X|
t
) + E(|Y |
t
) < .
Como E(|X|
t
) < ento, E(|aX|
t
) < , a IR, esta propriedade diz que a classe
de variveis aleatrias em (, A, P) possuidoras do t-simo momento nito um espao
vetorial ou espao linear.
(viii) V (X) = E(X )
2
= min
cIR
E(X c)
2
.
Prova:
(X c)
2
= (X + c)
2
= (X )
2
+ 2( c)(X ) + ( c)
2
,
logo
E(X c)
2
= E(X )
2
+ 2( c)(E(X) ) + ( c)
2
= V (X) + ( c)
2
.
Portanto, E(X c)
2
E(X )
2
, c IR.
Campos & Rgo
6.6. A DESIGUALDADE DE TCHEBYCHEV 124
6.6 A Desigualdade de Tchebychev
Corolrio 6.6.1: Desigualdade (Original) de Tchebychev. Seja X uma varivel ale-
atria, ento
P(|X E(X)| )
V (X)

2
.
Prova: Seja A = {x : |x| } e g(x) =
x
2

2
. Note que g(x) I
A
(x), ento pelo teorema
anterior, P(X A) = P(|X| )
E(X
2
)

2
. Substituindo X por X E(X), tem-se
P(|X E(X)| )
V (X)

2
.
Corolrio 6.6.2: Desigualdade de Tchebychev Generalizada. Dado um conjunto A
e uma funo g(x) tal que x, g(x) I
A
(x), tem-se que P(X A) min(1, E(g(X))).
Prova: Pela monotonicidade da esperana, E(g(X)) E(I
A
(X)) = P(X A). Mas, como
a cota superior pode exceder 1, tem-se que min(1, E(g(X))) P(X A).
Corolrio 6.6.3: Seja X uma varivel aleatria, ento para todo > 0,
P(|X| )
E|X|

.
Prova: Escolha A = {x : |x| } e g(x) =
|x|

. Note que g(x) I


A
(x), ento P(|X| )
E(|X|)

.
Corolrio 6.6.4: Se Z 0 e E(Z) = 0, ento P(Z = 0) = 1.
Prova: P(Z
1
n
) nE(Z) = 0. Como [Z > 0] =
n
[Z
1
n
],
P(Z > 0) = P(
n
[Z
1
n
])

n
P(Z
1
n
) = 0.
Portanto, P(Z = 0) = 1 P(Z > 0) = 1.
Este ltimo corolrio implica que, quando V (X) = 0, ou seja E(X E(X))
2
= 0, ento,
P(X = E(X)) = 1, isto , X constante com probabilidade 1.
Esta desigualdade declara que a probabilidade da varivel aleatria diferir da sua mdia
por mais do que uma constante qualquer () menor ou igual do que

2

2
. Portanto, quanto
menor a varincia, mais agrupados em torno da mdia esto os dados e, consequentemente,
maior a probabilidade de se obter um valor (dos dados) prximo mdia.
A desigualdade de Tchebychev geral no sentido de que no h qualquer hiptese sobre
a lei de probabilidade de X. A nica restrio que
2
< .
Campos & Rgo
6.7. MOMENTOS CONJUNTOS 125
6.7 Momentos Conjuntos
A noo de momentos conjuntos denida no contexto de vetores aleatrios.
Denio 6.7.1: Seja

X = (X
1
, X
2
, . . . , X
k
) um vetor aleatrio k-dimensional. Ento, os
momentos conjuntos de

X so da forma E(

k
i=1
X
j
i
i
), onde j
i
s so inteiros positivos, se esta
esperana existir.
De forma anloga ao caso unidimensional pode-se denir tambm momentos conjuntos
centrais.
No caso bidimensional a correlao e a covarincia so momentos conjuntos; estes medem
o grau de dependncia linear entre duas variveis.
Denio 6.7.2: A covarincia entre duas variveis aleatrias X e Y dada por
Cov(X, Y ) = E((X E(X))(Y E(Y ))) = E(XY ) E(X)E(Y ).
Note que Cov(X, X) = V (X). Na prova da Propriedade (v) da varincia aparece a
expresso E(XY ) E(X)E(Y ), o que implica que, se X e Y no forem independentes,
V (X + Y ) = V (X) + V (Y ) + 2Cov(X, Y ).
A seguir ser vista uma expresso para a varincia da soma de n variveis aleatrias.
Teorema 6.7.3: Sejam X
1
, X
2
, . . . , X
n
variveis aleatrias tais que V (X
i
) < , ento
V (X
1
+ . . . + X
n
) =
n

i=1
V (X
i
) + 2

i<j
Cov(X
i
, X
j
).
Prova:
V (X
1
+ + X
n
) = E(X
1
+ + X
n
E(X
1
+ + X
n
))
2
= E(
n

i=1
(X
i
E(X
i
))
2
= E(
n

i=1
(X
i
E(X
i
))
2
+ 2

i<j
(X
i
E(X
i
))(X
j
E(X
j
)))
=
n

i=1
V (X
i
) + 2

i<j
Cov(X
i
, X
j
).
Corolrio 6.7.4: Sejam X
1
, X
2
, . . . , X
n
variveis aleatrias tais que V (X
i
) < e
Cov(X
i
, X
j
) = 0 para i = j, ento
V (X
1
+ . . . + X
n
) =
n

i=1
V (X
i
).
Campos & Rgo
6.7. MOMENTOS CONJUNTOS 126
O prximo teorema trata de importante desigualdade em teoria da probabilidade:
Teorema 6.7.5: (E(XY ))
2
E(X
2
)E(Y
2
).
Prova: (aX+Y )
2
0 E(aX+Y )
2
0 a
2
E(X
2
)+2aE(XY )+E(Y
2
) 0. Observa-se
que esta equao do segundo grau em a no pode ter duas razes reais diferentes, pois caso
contrrio essa expresso seria negativa para os valores entre as razes. Ento, utilizando a
regra do discriminante,
4(EXY )
2
4EX
2
EY
2
0,
o teorema est provado.
Corolrio 6.7.6: (Cov(X, Y ))
2
V (X)V (Y ).
Prova: Segue do teorema anterior trocando X por X E(X) e Y por Y E(Y ).
Denio 6.7.7: O coeciente de correlao entre duas variveis aleatrias X e Y dado
por
(X, Y ) =
Cov(X, Y )
_
V ar(X)V ar(Y )
.
Denio 6.7.8: Duas varveis so no-correlacionadas se Cov(X, Y ) = 0.
Como j foi provado que se X e Y so independentes, ento E(XY ) = E(X)E(Y ), se
X e Y so independentes, elas necessariamente so no-correlacionadas. O contrrio nem
sempre verdadeiro como o prximo exemplo ilustra.
Exemplo 6.7.9: Se X uma varivel aleatria tal que P(X = a) = P(X = a) = 1/2 e
Y = X
2
, ento E(XY ) = a
3
(1/2) + a
3
(1/2) = 0 e E(X) = a(1/2) + a(1/2) = 0. Logo,
E(XY ) = E(X)E(Y ) = 0, ou seja, Cov(X, Y ) = 0. Porm, X e Y no so independentes,
pois Y uma funo de X.
O teorema anterior provou que |(X, Y )| 1. O prximo teorema mostra que o mdulo
do coeciente de correlao entre duas variveis igual a 1 se, e somente se, as variveis so
linearmente dependentes.
Teorema 6.7.10: Sejam X e Y variveis aleatrias com varincias nitas e positivas.
Ento,
(i) (X, Y ) = 1 se, e somente se, P(Y = aX + b) = 1 para algum a > 0 e b IR.
(ii) (X, Y ) = 1 se, e somente se, P(Y = aX + b) = 1 para algum a < 0 e b IR.
Prova:
Campos & Rgo
6.7. MOMENTOS CONJUNTOS 127
(i) Como (
XE(X)

V (X)

Y E(Y )

V (Y )
)
2
0, ento,
0 E(
X E(X)
_
V (X)

Y E(Y )
_
V (Y )
)
2
= E(
X E(X)
_
V (X)
)
2
+ E(
Y E(Y )
_
V (Y )
)
2

2
_
V (X)V (Y )
E((X E(X))(Y E(Y )))
=
V (X)
V (X)
+
V (Y )
V (Y )

2Cov(X, Y )
_
V (X)V (Y )
= 2 2(X, Y ).
Se (X, Y ) = 1, ento
E(
X E(X)
_
V (X)

Y E(Y )
_
V (Y )
)
2
= 0,
o que por sua vez implica que
P(
X E(X)
_
V (X)
=
Y E(Y )
_
V (Y )
) = 1,
em outras palavras,
P(Y = E(Y ) +
_
V (Y )
_
V (X)
(X E(X))) = 1.
(ii) Anloga, substituindo o sinal + por - na expresso acima.
O prximo teorema apresenta uma nova relao entre momentos conjuntos de variveis
aleatrias. Ele conhecido como Desigualdade de Hlder.
Teorema 6.7.11: Suponha que p e q satisfazem: p > 1, q > 1, e
1
p
+
1
q
= 1. Ento, se
E(|X|
p
) < e E(|X|
q
) < , tem-se que
E(|XY |) (E|X|
p
)
1/p
(E|Y |
q
)
1/q
.
Prova: A prova da desigualdade de Hlder utiliza um argumento de convexidade. Como
|X|
p
0 (resp., |X|
q
0), j foi visto que se E(|X|
p
) = 0, ento P(X = 0) = 1. Portanto,
em ambos os casos E(|XY |) = 0 e a desigualdade de Hlder vlida. Considere ento o
caso em que o lado direito da desigualdade de Hlder estritamente positivo.
Para a > 0 e b > 0, existe s, t IR tal que
a = exp(
s
p
) e b = exp(
t
q
).
Campos & Rgo
6.8. ESPERANA CONDICIONAL 128
Como a funo exponencial convexa e p
1
+ q
1
= 1, por convexidade,
exp(
s
p
+
t
q
) p
1
exp(s) + q
1
exp(t),
ou pela denio de s, t
ab p
1
a
p
+ q
1
b
q
.
Agora substituindo a por
|X|
(E(|X|
p
))
1/p
e b por
|Y |
(E(|Y |
q
))
1/q
, temos
|XY |
(E(|X|
p
))
1/p
(E(|Y |
q
))
1/q
p
1
(
|X|
(E(|X|
p
))
1/p
)
p
+ q
1
(
|Y |
(E(|Y |
q
))
1/q
)
q
.
Finalmente, tomando o valor esperado,
E(|XY |)
(E(|X|
p
))
1/p
(E(|Y |
q
))
1/q
p
1
(
E(|X|
p
)
(E((|X|
p
)))
)
p
+ q
1
(
E|Y |
q
(E(|Y |
q
))
)
q
= p
1
+ q
1
= 1.
6.8 Esperana Condicional
6.9 Aprendendo um pouco mais...
Antes de se introduzir a denio geral da esperana de uma varivel aleatria qualquer,
sero vistos conceitos sobre as integrais de Riemann-Stieltjes e de Lebesgue-Stieltjes.
6.9.1 As integrais de Riemman-Stieltjes e de Lebesgue-Stieltjes
Antes das denies das integrais de Riemman-Stieltjes e Lebesgue-Stieltjes, tem-se a deni-
o da integral de Riemann.
Uma partio P do intervalo [a, b] uma sequncia de pontos {x
1
, . . . , x
n
} tal que a =
x
1
< x
2
< < x
n
= b; a norma da partio P denida como sendo max
1in1
x
i+1
x
i
.
Suponha que seja uma funo real qualquer denida no intervalo [a, b]. Diz-se que esta
funo Riemann integrvel se a soma de Riemann
n1

i=1
(y
i
)(x
i+1
x
i
),
onde y
i
[x
i
, x
i+1
], convergem quando a norma de P tende a zero e este limite independente
da escolha dos y
i
s e da partio P. Se esta integral existe denota-se o limite por
_
b
a
(x)dx.
A integral de Riemann-Stieltjes uma generalizao ad integral de Riemann. Se
uma funo contnua denida no intervalo [a, b] e F uma funo de distribuio, dene-se
Campos & Rgo
6.9. APRENDENDO UM POUCO MAIS... 129
a integral de Riemann-Stieltjes de em [a, b], em relao a F, como o limite de somas de
Riemann da forma
n1

i=1
(y
i
)[F(x
i+1
) F(x
i
)],
onde a = x
1
< x
2
< < x
n
= b, y
i
um ponto arbitrrio de [x
i
, x
i+1
] e toma-se o limite
quando a norma de partio P tende a zero. Tal limite existe e nito sob as condies
descritas sendo representado por
_
b
a
(x)dF(x).
A fun chamada de integrando e F de integrador. O limite acima existe mesmo que
F no seja uma funo de distribuio, basta que seja de variao limitada.
Denio 6.9.1: Dene-se variao total de uma funo f em [a, b] pelo funcional:
V (f, [a, b]) = sup
n

i=1
|f(x
i+1
) f(x
i
)|,
onde o supremo tomado sobre todas as possveis parties do intervalo fechado [a, b]. Uma
funo de variao limitada se V (f, [a, b]) < .
A integral de Rieman-Stieltjes sobre a reta uma integral imprpria denida da mesma
maneira que a integral imprpria de Riemann:
_

(x)dF(x) = lim
a,b
_
b
a
(x)dF(x),
se o limite existe. Esta denio da integral de Riemann-Stietjes pode ser estendida a outras
funes alm das contnuas.
Para uma funo qualquer , dene-se
_
b
a
(x)dF(x) como sendo o limite das somas de
Riemann descritas acima quando a norma da partio tende a zero, se este limite existe e
independente das escolhas dos y
i
s e da partio P. O problema que mesmo para funes
bem simples este limite pode no existir como mostra o prximo exemplo.
Exemplo 6.9.2: Seja F
0
(x) = 1 se x 0, e F
0
(x) = 0, caso contrrio. Considere-se a
integral de Riemann-Stieltjes de F
0
em [1, 1] em relao a F
0
. Note que se zero no um
dos pontos da partio, de modo que x
i
< 0 < x
i+1
para algum i, com F
0
(x
i+1
) F
0
(x
i
) = 1,
ento o somatrio assume como valor escolhido para y
i
ser maior que 0, ou no.
Uma integral que no sofre desta decincia a integral de Lebesgue-Stieltjes. A idia da
integral de Lebesgue-Stieltjes particionar a imagem da funo ao invs de particionar o
seu domnio. Diz-se que uma partio P

um renamento de P se P P

, ou seja, quando
os intervalos da partio P so particionados na partio P

.
Campos & Rgo
6.9. APRENDENDO UM POUCO MAIS... 130
Suponha que seja no negativa e mensurvel em relao a -lgebra de Borel. Seja
uma medida nos reais, ou seja, uma funo cujo domnio a -lgebra de Borel que tem como
imagem do conjunto vazio zero, no-negativa e -aditiva. Dada uma sequncia {P
1
, P
2
, . . .}
de parties de [0, ) onde P
n
= {y
1
, y
2
, . . . , y
n
}, y
n
, P
i+i
um renamento de P
i
,
e a norma de P
n
tende a zero quando n , dene-se a soma de Lebesgue em relao a
partio P
n
como sendo,
n1

i=1
y
i
({x : y
i
(x) < y
i+1
}) + y
n
({x : (x) y
n
}).
A integral de Lebesgue-Stieltjes de em relao a denida como sendo igual ao limite
das somas de Lebesgue, quando n . Dadas as condies acima, este limite sempre existe
(pode ser +) e denotado por
_
d.
Para uma funo mensurvel qualquer, pode-se escrever =
+

, onde
+
=
max(, 0), a parte positiva de , e

= min(, 0), o mdulo da parte negativa de , so


funes no-negativas e portanto possuem integral de Lebesgue-Stieltjes. Se
+
ou

possui
integral de Lebesgue-Stieltjes nita em relao a , dene-se a integral de Lebesgue-Stieltjes
de em relao a como sendo
_
d =
_

+
d
_

d.
Se for uma medida de probabilidade em (IR, B) e F for a distribuio de probabi-
lidade acumulada associada varivel aleatria X() = , ento escreve-se
_
(x)dF(x)
(ou simplesmente,
_
dF) para denotar
_
d. Em geral, usa-se a notao
_
(x)dF(x)
no somente para funes de distribuio, mas para qualquer funo F que pode ser es-
crita como a diferena de duas funes montonas no-decrescentes, limitadas e contnuas
direita. Se G for uma funo montona no-decrescente, limitada e contnua direita,
ento dado um intervalo qualquer I = [x
1
, x
2
], denindo-se (I) = G(x
2
) G(x
1
), usa-se a
notao
_
(x)dG(x) para denotar a integral
_
(x)d, onde a nica medida que satisfaz
(I) = G(x
2
) G(x
1
) para todo intervalo I. Desta forma, se F = G
1
G
2
, onde G
1
e G
2
so funes montonas no-decrescentes, limitadas e contnuas direita, ento
_
(x)dF(x)
utilizado para denotar
_
(x)dG
1
(x)
_
(x)dG
2
(x).
Dada um intervalo qualquer [a, b], dene-se a integral de Lebesgue-Stieltjes de em
relao a no intervalo [a, b] como sendo
_
I
[a,b]
d
e denota-se por
_
b
a
d.
6.9.2 Propriedades da Integral de Lebesgue-Stieltjes
(i) Quando o integrando contnuo, a integral de Lebesgue-Stieltjes torna-se uma integral
de Riemman-Stieltjes.
Campos & Rgo
6.9. APRENDENDO UM POUCO MAIS... 131
(ii)
_
b
a
dF = F(b) F(a).
Propriedade anloga ao Teorema Fundamental do Clculo:
_
b
a

(x)dx = (b) (a),


onde (x) a derivada de .
(iii) Linearidade no integrando e no integrador. Se (x) = f(x) + g(x), ento
_
dF =
_
fdF +
_
gdF,
e para H(x) = F(x) + G(x),
_
dH =
_
dF +
_
dG.
(iv) Aditividade. Se a < b < c , ento
_
c
a
dF =
_
b
a
dF +
_
c
b
dF.
(v) Se F for a funo de distribuio de uma varivel aleatria discreta, ou seja, se
F(x) =

i=1
p
i
U(x x
i
),
onde P(X = x
i
) = p
i
e

i=1
p
i
= 1, ento
_
dF =

i=1
p
i
(x
i
).
(vi) Se F for a funo de distribuio de uma varivel aleatria contnua tendo densidade
f, ento
dF(x)
dx
= f(x) em quase toda parte, e consequentemente,
_
(x)dF(x) =
_
(x)f(x)dx.
(vii) No caso de uma distribuio qualquer F, foi visto que F pode ser decomposta em suas
partes discreta, contnua e singular da seguinte forma F = F
d
+ F
ac
+ F
s
, ento por
linearidade do integrador:
_
(x)dF(x) =
_
(x)dF
d
(x) +
_
(x)dF
ac
(x) +
_
(x)dF
s
(x).
Se a parte singular for nula, F
s
(x) = 0, x,
Campos & Rgo
6.9. APRENDENDO UM POUCO MAIS... 132
_
(x)dF(x) =

i
(x
i
)p
i
+
_
(x)f(x)dx,
onde p
i
o salto de F em x
i
e f a derivada de F.
6.9.3 Denio da Esperana - Caso Geral
Considere uma sequncia {P
1
, P
2
, . . .} de parties de [0, ) onde P
n
= {y
1
, y
2
, . . . , y
n
},
y
n
, P
i+i
um renamento de P
i
, e a norma de P
n
tende a zero quando n . Dada
uma varivel aleatria no-negativa qualquer X e uma partio P
n
desta sequncia, den-
se uma outra varivel aleatria Y discreta que aproxima X assumindo o valor y
i
quando
y
i
X < y
i+1
e Y = y
n
se X y
n
, ou seja, Y =

n1
i=1
y
i
I
[y
i
X<y
i+1
]
+ y
n
I
[Xyn]
. Como Y
discreta tem-se que sua esperana dada por
E(Y ) =
n

i=1
y
i
P(Y = y
i
) =
n1

i=1
y
i
P(y
i
X < y
i+1
) + y
n
P(X y
n
).
Esta esperana uma soma de Lebesgue em relao partio P
n
com integrando X e
funo integradora dada pela medida de probabilidade P. Note que a medida que parties
mais renadas so consideradas na sequencia, Y se torna cada vez uma melhor aproximao
para X. J que os valores de X e Y cam cada vez mais prximos intuitivo requerer que a
denio de esperana (mdia) E(X) seja igual ao limite de E(Y ) quando n , ou seja
E(X) = lim
n
n

i=1
y
i
P(Y = y
i
) = lim
n
n1

i=1
y
i
P(y
i
X < y
i+1
) + y
n
P(X y
n
) =
_
XdP.
Logo, E(X) denida como sendo a integral de Lebesgue-Stieltjes de X em relao a medida
de probabilidade P, ou similarmente, E(X) =
_
XdF, onde F a funo de distribuio
acumulada de X. No caso geral, tem-se a seguinte denio
Denio 6.9.3: Se X uma varivel aleatria com funo de distribuio F, ento sua
esperana dada pela frmula
E(X) =
_
XdF =
_
0

XdF +
_

0
XdF,
desde que pelo menos uma das integrais seja nita. Em caso das duas integrais no serem
nitas, a esperana no existe. Caso E(X) seja nita, diz-se que X integrvel.
Pela Propriedade (vii) da integral de Lebesgue-Stieltjes, tem-se que se F = F
d
+F
ac
+F
s
,
ento
E(X) =
_
XdF =

i
x
i
p
i
+
_
xf(x)dx +
_
xdF
s
(x),
onde p
i
o salto de F em x
i
e f a derivada de F. Como a parte singular costuma ser
nula, na prtica a esperana reduz-se a uma srie ou uma integral imprpria, usualmente de
Riemann se f for integrvel a Riemann.
Campos & Rgo
6.9. APRENDENDO UM POUCO MAIS... 133
Exemplo 6.9.4: Considere uma varivel aleatria Y com funo de distribuio F, tal que
F(x) =
_
_
_
0, se x < 0,
x, se 0 x < 1/2,
1, se x 1/2.
Decompondo F nas partes discreta e contnua tem-se
F
d
(x) =
_
0, se x < 1/2,
1/2, se x 1/2,
e
F
ac
(x) =
_
_
_
0, se x < 0,
x, se 0 x < 1/2,
1/2, se x 1/2.
Portanto,
E(Y ) =
1
2
P(Y =
1
2
) +
_
1/2
0
ydy =
1
4
+
1
8
=
3
8
.
6.9.4 Interpretao Geomtrica da Esperana
Por denio, E(X) =
_
xdF(x), ou seja, E(X) a integral da diferencial xdF. Mas xdF
uma diferencial de rea. Para x > 0, xdF uma diferencial da rea da regio compreendida
entre as curvas x = 0, y = 1, e y = F(x) no plano Euclideano, cuja rea total dada por
_

0
(1 F(x))dx. Para x < 0, xdF uma diferencial da rea da regio compreendida
entre as curvas x = 0, y = 0, e y = F(x) no plano Euclideano, cuja rea total dada por
_
0

F(x)dx. Logo, E(X) =


_

0
(1 F(x))dx
_
0

F(x)dx.
Prova:
Formalmente, prova-se isso da seguinte maneira. A prova dividida em duas etapas: (a)
_

0
xdF(x) =
_

0
(1F(x))dx e (b)
_
0

xdF(x) =
_
0

F(x)dx. Provando (b). Utilizando


integrao por partes, tem-se que a < 0,
_
0
a
xdF(x) = aF(a)
_
0
a
F(x)dx =
_
0
a
(F(a) F(x))dx.
Como F(a) 0 e a < 0,
_
0
a
xdF(x)
_
0
a
F(x)dx.
Como a desigualdade vlida para todo a < 0, tomando o limite quando a
_
0

xdF(x)
_
0

F(x)dx.
Por outro lado, seja < 0. Se a < , ento
Campos & Rgo
6.9. APRENDENDO UM POUCO MAIS... 134
_
0
a
(F(a) F(x))dx
_
0

(F(a) F(x))dx = F(a)()


_
0

F(x)dx,
e portanto, tomando o limite quando a ,
_
0

xdF(x)
_
0

F(x)dx.
Como isto vlido para todo < 0, tomando o limite quando ,
_
0

xdF(x)
_
0

F(x)dx.
Para a parte (a), utilizando integrao por partes, tem-se que b > 0,
_
b
0
xdF(x) = bF(b)
_
b
0
F(x)dx =
_
b
0
(F(b) F(x))dx.
Como F(b) 1 e 1 F(x) 0,
_
b
0
xdF(x) =
_
b
0
[F(b) F(x)]dx
_

0
(1 F(x))dx.
Como a desigualdade vlida para todo b > 0, e tomando o limite quando b
_

0
xdF(x)
_

0
(1 F(x))dx.
Por outro lado, seja > 0. Se b > , ento
_
b
0
[F(b) F(x)]dx
_

0
[F(b) F(x)]dx
=
_

0
[F(b) 1]dx +
_

0
[1 F(x)]dx
= [F(b) 1] +
_

0
[1 F(x)]dx,
e portanto, tomando o limite quando b ,
_

0
xdF(x)
_

0
[1 F(x)]dx.
Como isto vlido para todo > 0, tomando o limite quando ,
_

0
xdF(x)
_

0
[1 F(x)]dx.
A desigualdade de Jensen uma das propriedades da esperana.
Campos & Rgo
6.9. APRENDENDO UM POUCO MAIS... 135
Corolrio 6.9.5: (Desigualdade de Jensen) Seja uma funo mensurvel e convexa de-
nida na reta. Se X integrvel, ento E((X)) (E(X)).
Prova: Pela convexidade de , dado algum ponto (x
0
, (x
0
) do grco de , existe uma
reta que passa por esse ponto e ca sempre abaixo do grco de , ou seja, existe algum
tal que
(x) (x
0
) + (x x
0
), x.
Logo, pela monotonicidade e linearidade da esperana,
E(X) (x
0
) + (E(X) x
0
).
Em particular, para x
0
= EX, tem-se E(X) (E(X)).
O prximo lema estabelece um critrio para integrabilidade de variveis aleatrias.
Lema 6.9.6: Seja X uma varivel aleatria qualquer. Ento,

n=1
P(|X| n) E|X| 1 +

n=1
P(|X| n),
e, portanto, X integrvel se, e somente se,

n=1
P(|X| n) < .
Prova: Se x 0, seja x a parte inteira de x. Ento, a varivel aleatria |X| assume o
valor k quando k |X| < k + 1 e 0 |X| |X| |X| + 1, ento pela monotonicidade
e linearidade da esperana,
0 E|X| E|X| 1 +E|X|.
Como |X| uma varivel aleatria que s assume valores inteiros no-negativos,
E|X| =

n=1
P(|X| n) =

n=1
P(|X| n),
logo

n=1
P(|X| n) E(|X|) 1 +

n=1
P(|X| n).
Se X
+
= max(X, 0) e X

= min(X, 0), ento X = X


+
X

e |X| = X
+
+ X

. Por
denio, E(X) < se, e somente se, E(X
+
) < e E(X
)
< . Portanto, E(X) <
se, e somente se, E(|X|) < . De forma anloga, pode-se concluir que E((X)) < se, e
somente se, E(|(X)|) < para qualquer funo mensurvel .
O prximo teorema fornece um outro critrio para integrabilidade de uma varivel alea-
tria.
Campos & Rgo
6.10. EXERCCIOS 136
Teorema 6.9.7: Sejam X e Y variveis aleatrias tais que Y 0, Y integrvel e |X| < Y .
Ento, X integrvel.
Prova: Note que 0 |X| Y implica que 0 E(|X|) E(Y ). Portanto, se E(Y ) < ,
ento E(|X|) < , o que por sua vez implica que E(X) < .
Os dois importantes teoremas (Burrill, 1972) a seguir tratam da convergncia de esperan-
as de variveis aleatrias. O critrio de convergncia envolvido o pontual ou seja, X
n
X
se, e somente se, X
n
(w) X(w) para todo w .
Teorema 6.9.8: Teorema da Convergncia Montona. Sejam X, X
1
, X
2
, . . . variveis
aleatrias. Se 0 X
n
X, ento, E(X
n
) E(X).
Teorema 6.9.9: Teorema da Convergncia Dominada. Sejam Y, X, X
1
, X
2
, . . . vari-
veis aleatrias. Considere que Y seja integrvel, |X
n
| Y e X
n
X. Assim X e X
n
so
integrveis e E(X
n
) E(X).
O prximo exemplo mostra que nem sempre X
n
X E(X
n
) E(X).
Exemplo 6.9.10: Seja Y U(0, 1). Considere a seguinte sequncia {X
1
, X
2
, . . .} de
variveis aleatrias: X
n
() = n se Y () (0, 1/n) e X
n
() = 0, caso contrrio. Ento,
X
n
() 0, . Mas, E(X
n
) = 1 = 0 = E(0), ou seja, E(X
n
) 0.
6.10 Exerccios
1. Seja
f(x, y) =
_
2, 0 < x < y, 0 < y < 1
0, quaisquer outros casos
a funo densidade conjunta do vetor aleatrio (X, Y ).
Sejam u(X, Y ) = X, v(X, Y ) = Y e w(X, Y ) = XY .
Mostre que E(u(X, Y )) E(v(X, Y )) = E(w(X, Y )).
2. Suponha que a demanda (procura) por semana de um certo produto seja uma varivel
aleatria D com distribuio de probabilidade p
k
= P(D = k), para k = 0, 1, 2, .
Para este produto sabe-se que o preo de custo C
1
, enquanto o preo de venda
C
2
. Se o produto no for vendido at o nal da semana, deve ser refugado a um custo
adicional C
3
. Se o fabricante decide fabricar N desses produtos no incio da semana,
pede-se:
(a) A distribuio de probabilidade da varivel aleatria lucro por semana.
(b) O lucro esperado por semana.
3. Sejam os inteiros de 1 a 10 e suponha que um deles seja escolhido aleatoriamente.
Considere a varivel aleatria X como sendo o nmero de divisores do nmero sorteado.
Calcule o nmero mdio de divisores do nmero sorteado.
Campos & Rgo
6.10. EXERCCIOS 137
4. n mensagens esto sendo enviadas atravs de um canal de comunicao. Os tempos
de durao das mensagens, T
i
, i = 1 , n so aleatrios, e tm a mesma mdia , a
mesma varincia
2
e so independentes.
(a) Encontre a mdia e a varincia do tempo total T de transmisso das n mensagens.
(b) Encontre T
max
, que o tempo mximo praticamente possvel durante o qual as
mensagens podem ser transmitidas. Sugesto:
X
3
X
, three sigma rule.
5. Resolva o problema anterior quando os comprimentos das mensagens so dependentes
e o coeciente de correlao entre as variveis T
i
e T
j
r
ij
.
6. A administrao de uma rede planeja o momento Y de comeo de uma operao
como sendo o tempo mximo em que duas operaes de suporte, X
1
e X
2
, tenham
terminado. As variveis aleatrias X
1
e X
2
so mutuamente independentes e tm
densidades, respectivamente, f
X
1
e f
X
2
. Encontre a mdia e a varincia da varivel Y .
7. Uma mensagem enviada atravs de um canal de comunicao, consiste de n dgitos 0 ou
1, sendo cada um igualmente provvel e independentes. Dena uma varivel aleatria
X como o nmero de mudanas nos dgitos.
(a) Encontre a mdia e a varincia de X.
(b) Encontre o nmero mximo praticamente possvel de mudanas.
8. Se X e Y so varveis aleatrias independentes, discretas ou contnuas Mostre que,
y R
Y
,
E(X | Y = y) = E(X).
9. Se (X, Y ) tem uma densidade conjunta f(x, y) = 2, para 0 < x < y < 1. Compute:
(a) E(Y X);
(b) V (Y X).
10. Dada a densidade conjunta do vetor aleatrio (X, Y ),
f(x, y) = 6(1 x y), 0 < y < 1 x < 1,
calcule
(a) as densidades de X e Y ;
(b) E(XY ).
11. Um jogador lana duas moedas no-viciadas. Ganha 1 u.m. (unidade monetria) ou 2
u.m., conforme ocorra uma ou duas caras. Por outro lado, perde 5 u.m. se no ocorrer
cara. Ache o valor esperado E do jogo e verique se o mesmo favorvel ao jogador.
Campos & Rgo
6.10. EXERCCIOS 138
12. Analysing the Quick-Sort Algorithm. Suppose we are given a set of n distinct values,
x
1
, , x
n
, and we desire to put these values in increasing order, or as it is commonly
called, to sort them. An ecient procedure for accomplishing this is the quick-sort
algorithm which is dened recursively s follows: When n = 2 the algorithm compares
the 2 values and puts them in the appropriate order. When n > 2 it starts by choosing
at random one of the n values, say x
i
, and then compares each of the other n 1
values with x
i
, noting which are smaller and which are larger than x
i
. Letting S
i
denote the set of elements smaller than x
i
, and S
i
, the set of elements greater than
x
i
, the algorithm now sorts the set S
i
and the set S
i
. The nal ordering, therefore,
consists of the ordered set of elements in S
i
, then x
i
, and then the ordered set of
elements in S
i
. One measure of the eectiveness of this algorithm is the expected
number of comparisons that it makes. Let M
n
the expected number of comparisons
needed by the quick-sort algorithm to sort a set of n distinct values. Find E(M
n
) (S.
M. Ross, Introduction to Probability Models, fth edition, pp. 96).
13. A List Model. Consider n elements e
1
, , e
n
, which are initially arranged in some
ordered list. At each unit of time a request is made for one of these elements, e
i
, being
requested, independently of the past, with probabilityn p
i
. After being requested the
element is then moved to the front of the list. We are interested in determining the
expected position of the element requested after this process has been in operation for
a long time (S. M. Ross, Introduction to Probability Models, fth edition, pp. 107).
Campos & Rgo

You might also like