You are on page 1of 65

1

APOSTILA DE TEORIA DA PROBABILIDADE











LEONARDO MACRINI
UFRRJ - 2013

2

=======================================================================
Alguns esclarecimentos antes da leitura desta apostila
A presente apostila no apresenta nada, ou quase nada, de original. Ela
constituda de trechos de algumas obras* de forma a contemplar as ementas dos
cursos de Economia e Administrao do ITR/UFRRJ. Muitos tpicos da teoria, como por
exemplo, em variveis aleatrias contnuas, foram omitidas propositalmente para
atender as referidas ementas. Qualquer contribuio, crtica, etc, ser muito bem
vinda. Em futuro prximo esperamos acrescentar os tpicos faltantes de forma que
esta apostila sirva a outros cursos de graduao.
*
- Inferncia Estatstica Casella, G. & Berger, R. Cengage Leraning 2010.
- Probability and Statistical Inference Hogg, R. V. & Tanis, E. A. Prentice Hall
2010
- A First Course in Probability Ross, S. - Prentice Hall 2010
- Introduction to the Theory of Statistics Mood, A. M. & Graybill, F.A. McGraw-
Hill - 1974
- Probabilidade e Variveis Aleatrias Magalhes, M. N. So Paulo IME-USP -
2004
- Probabilidade Meyer, L. M. Livros Tcnicos e Cientficos 1980.
- Estatstica Bsica Morettin, L. G. Makron Books 1999
- Notas de Inferncia estatstica Barros, M. PUC-Rio 1999
- Estatstica Bsica Bussab & Morettin Ed. Saraiva 2010
- Introduction to Probability Theory and Statistical Inference Larson, H. J. John
Wiley & Sons - 1982
=======================================================================

As questes mais importantes da vida so, em grande parte, nada mais do
que problemas de probabilidade.
A teoria da probabilidade nada mais do que o clculo do bom senso.
Pierre-Simon Laplace (1749 1827)
O objetivo da teoria da probabilidade modelar matematicamente conceitos como
incerteza, risco, chance, possibilidade, verossimilhana, perspectivas e, at mesmo,
sorte. Considere as seguintes frases do nosso dia-a-dia:
- A probabilidade de uma moeda lanada dar coroa de 50%;
- A previso do tempo de 40% de probabilidade de chuva amanh;
- A radiografia indica uma moderada probabilidade de Trombo embolia
Pulmonar;
- O Copom afirma que aumentou a probabilidade da convergncia da inflao
para a trajetria de metas;

3

- Depois da rodada de ontem, a probabilidade do Flamengo ser rebaixado
aumentou.
Quase todos nos temos ao menos uma intuio do que estas frases significam. No
entanto, encontre a sua resposta para a seguinte pergunta: o que exatamente significa
a palavra probabilidade?
A Teoria da Probabilidade apenas um modelo. Modelos no so A REALIDADE ou
A VERDADE. Modelos so teis exatamente porque simplificam a realidade para que
possamos entend-los (Num mapa de metr, as estaes aparecem alinhadas; o mapa
no mostra todas as ruas, nem os jardins, nem a topografia da cidade. O mapa esta
errado? No, o mapa um modelo; ele perfeito para a sua funo (saber se a
prxima estao onde eu tenho que descer ou no), mas, se usado alm de suas
limitaes (para planejar uma caminhada, por exemplo), ele falha miservelmente.)
No fundo, todo modelo ruim, alguns so teis.
Como lidamos com nossa prpria incerteza e ignorncia desde que nascemos, o
conceito de probabilidade at que no to misterioso assim.
O entendimento da natureza das coisas pela experimentao, ao contrario do
conhecimento especulativo da tradio medieval, tornou-se o caminho para as
conquistas que poderiam proporcionar ao gnero humano o melhoramento de suas
condies de existncia.
Charles Darwin reconheceu na variao biolgica um dos aspectos fundamentais da
vida e dela fez a base de sua teoria da sobrevivncia do mais apto. Foi contudo seu
colega ingls Karl Pearson quem primeiro observou a natureza subjacente dos
modelos estatsticos e como eles ofereciam algo diferente da viso determinista da
cincia do sculo XIX.
As demandas geradas, pela astronomia e pela fsica experimental fizeram com que boa
parte do trabalho dos matemticos do fim do sculo XVIII e inicio do sculo XIX
consistisse em compreender e quantificar os erros aleatrios. Tais esforos levaram a
uma nova rea, a estatstica matemtica, que gerou uma serie de ferramentas para a
interpretao dos dados surgidos da observao e da experimentao.
A distribuio dos erros de determinar a posio de Jpiter na noite de Natal ou o
peso de um pedao de po com passas recm sado da linha de montagem ser a
mesma. A idia de que a distribuio dos erros segue uma lei universal, por vezes
chamada de Lei dos Erros, o preceito central no qual se baseia a teoria da medio.
Isso no significa que os erros aleatrios sejam o nico tipo de erro capaz de afetar a
medio.
Laplace, em 1820, descreveu a primeira distribuio de probabilidade, a distribuio
do erro, considerando erro, os desvios entre os valores observados e previstos.

APLICAES:
Na medicina usam modelos matemticos para determinar possveis efeitos nos
tratamentos sobre a sobrevivncia a longo prazo.
Socilogos e Economistas empregam distribuies matemticas para descrever o
comportamento da sociedade humana.
Em mecnica quntica, os fsicos utilizam as distribuies matemticas para descrever
as partculas subatmicas.

4

William Sealy Gosset: Trabalhou na Guinness, cerveja Irlandesa, e foi como
matemtico que deu sua primeira contribuio importante arte de fazer cerveja, que
dizia respeito quantidade de levedura (organismos vivos) a serem misturadas ao
malte modo. Gosset observou os dados e verificou que a contagem de clulas de
levedura poderia ser modelada com uma distribuio probabilstica conhecida como a
distribuio de Poisson. A partir desse procedimento a Guinness passou a fabricar
um produto mais consistente. Como a poltica da empresa no permitia que seus
funcionrios publicassem seus achados, essa primeira descoberta foi publicada
usando o pseudnimo de Student.
Series Temporais: Tem sido usada para examinar a freqncia de ondas nas costas do
Pacfico, nos Estados Unidos, e assim identificar tempestades no oceano ndico.
Distribuio dos Extremos: Ao sabermos como a distribuio de valores extremos se
relaciona com a distribuio de valores ordinrios, podemos manter um registro da
altura das enchentes anuais e prever a altura mais provvel do dilvio de 100 anos
(distribuio de Tippett). Pode-se determinar a altura dos diques a construir os navios
e permite a Agncia de Proteo Ambiental estabelecer padres para emisses que
controlaro os valores extremos de sbitas nuvens de gases que saem das chamins
industriais.
Kolmogorov, matemtico sovitico, compreendeu que encontrar a probabilidade de
um evento era exatamente igual a encontrar a rea de uma figura irregular. Adotou a
recm surgida matemtica da teoria da medio para os clculos de probabilidades e
com essas ferramentas foi capaz de identificar um pequeno conjunto de axiomas sobre
os quais pode construir todo o corpo da teoria da probabilidade.
Os matemticos do um nome pomposo a situao em que dois problemas so iguais,
embora paream diferentes: isomorfismo. Ex: Jogar uma moeda (cara e coroa) e
nascimento de um filho (menina e menino).
Os conceitos fundamentais para o clculo e para o trabalho de Bernoulli eram a
seqncia, srie e limite. Para o matemtico, o termo seqncia significa
essencialmente o mesmo que para todo mundo: uma sucesso ordenada de
elementos, como pontos ou nmeros. Uma srie simplesmente a soma de uma
seqncia de nmeros, e, em termos gerais, se os elementos de uma seqncia
parecem estar se encaminhando a algum lugar em direo a um ponto final, ou a um
numero especifico -, isso ento chamado de limite da seqncia.
Diferena fundamental entre probabilidade e estatstica: a primeira trata de
previses baseadas em probabilidades fixas, a segunda, de como inferir essas
probabilidades com base nos dados observados.
Ao se medir o tempo de vida dos soberanos e clrigos verifica-se que o tempo de vida
semelhante aos das pessoas com outras profisses, o que leva-nos a concluir que a
prece no apresenta nenhum beneficio.
O trabalho de Einstein de 1905 sobre a fsica estatstica tinha o objetivo de explicar um
fenmeno chamado movimento browniano. Einstein empregou a nascente teoria
para explicar, com grande detalhamento numrico, o mecanismo preciso do
movimento browniano. A necessidade de uma abordagem estatstica para a fsica
jamais seria questionada novamente, e a idia de que a matria feita de tomos e
molculas se tornariam a base de maior parte da tecnologia moderna e uma das idias
mais importantes na histria da fsica.
Finalmente: Depois da ona morta todo mundo caador.

5

Vamos enfim ao que interessa!!!

Teoria da Probabilidade
A teoria da probabilidade a base sobre a qual a estatstica desenvolvida,
fornecendo um meio para modelar populaes, experimentos ou, praticamente,
qualquer outra coisa que possa ser considerada como um fenmeno aleatrio.
Assim como a estatstica desenvolvida com base na teoria da probabilidade, esta, por
sua vez, fundamentada na teoria dos conjuntos, que por onde comeamos.
Definio: O conjunto S de todos os possveis resultados de um experimento
chamado de espao amostral do experimento.
Ex: lanamento de uma moeda -> S={Ca, Co}
Definio: Um evento qualquer conjunto de possveis resultados de um
experimento, ou seja, qualquer subconjunto de S (incluindo o prprio S).
Vamos definir as duas seguintes relaes:
B x A x B A e e c (conteno)
B x A x B A c c = (igualdade)
Exemplo: Suponha-se que S = Todos os nmeros reais, } 0 3 2 | {
2
= + = x x x A ,
} 0 ) 3 2 )( 1 ( | {
2
= + = x x x x B e } 2 , 1 , 3 | { = = x x C . Ento . C B e B A = c
Considerando dois conjuntos quaisquer (ou conjuntos) A e B, temos as seguintes
operaes elementares com conjuntos:
Unio: a unio de A e B, escrita como AB, o conjunto dos elementos que pertence
a A ou B, ou a ambos:
} : { B x ou A x x B A e e =
Interseo: a interseo de A e B, escrita como AB, o conjunto dos elementos que
pertencem tanto a A como a B:
} : { B x e A x x B A e e =
Complementao: o complemento de A, escrito como A
c
, o conjunto de todos os
elementos que no esto em A:
} : { A x x A
c
e =
Podemos agora estabelecer as seguintes propriedades teis das operaes com
conjuntos.
a. Comutatividade A B B A =
A B B A =
b. Associatividade C B A C B A = ) ( ) (
C B A C B A = ) ( ) (
c. Leis Distributivas ) ( ) ( ) ( C A B A C B A =
) ( ) ( ) ( C A B A C B A =

6

d. Leis DeMorgan
c c c
B A B A = ) (
c c c
B A B A = ) (
Vamos provar a Lei Distributivas: ) ( ) ( ) ( C A B A C B A =
Temos ento )} ( : { ) ( C B x e A x S x C B A e e e =
)} ( ) ( : { ) ( ) ( C A x ou B A x S x C A B A e e e =
Vamos supor que )) ( ( C B A x e . Pela definio de interseo, deve ocorrer que
) ( C B x e , ou seja, ou . C x ou B x e e Como x tambm deve estar em A, temos
que ); ( ) ( C A x ou B A x e e portanto,
)) ( ) (( C A B A x e ,
E a conteno esta estabelecida.
Agora assuma que )) ( ) (( C A B A x e . Isto implica que
) ( ) ( C A x ou B A x e e . Se , ) ( B A x e ento x esta em A e B.
Como , B xe ) ( C B x e , portanto, )) ( ( C B A x e . Se, por outro lado,
) ( C A x e , o argumento similar e, novamente, conclumos que
)) ( ( C B A x e . Deste modo, estabelecemos que
), ( ) ( ) ( C B A C A B A c mostrando a conteno na oura direo e,
assim, provando a lei distributiva.

As operaes de unio e interseo tambm podem ser ampliadas para seqncia
infinitas de conjuntos. Se A
1
, A
2
, A
3
, ......... uma seqncia de conjuntos, todos eles
definidos em um espao amostral S, ento

=
e e =
1
} lg : {
i
i i
i um a para A x S x A
} : {
1
i todo para A x S x A
i
i
i
e e =



Definio: Dois eventos A e B so disjuntos (ou mutuamente exclusivos) se
C = B A . Os eventos A
1
, A
2
, A
3
, ......... so disjuntos dois a dois (ou mutuamente
exclusivos) se C =
j i
A A para todo ij.
Definio: Se A
1
, A
2
, A
3
, ......... so disjuntos dois a dois e

=
=
1 i
i
S A , ento a
seqncia A
1
, A
2
, A
3
, ......... formam uma partio de S.

Exemplo: Suponha que S, o espao amostral, seja formado pelos inteiros positivos de 1
a 10. Sejam }, 4 , 3 , 2 { = A } 5 , 4 , 3 { = B e }. 7 , 6 , 5 { = C Enumere os elementos dos
seguintes conjuntos:
(a) B A (b) B A (c) B A (d) ) ( C B A (e) ) ( C B A

7

(a) } 5 { } 10 , 9 , 8 , 7 , 6 , 5 , 1 { = = B A A
(b) } 10 , 9 , 8 , 7 , 6 , 5 , 4 , 3 , 1 { } 10 , 9 , 8 , 7 , 6 , 5 , 1 { = = B A A
(c) } 10 , 9 , 8 , 7 , 6 , 1 { } 10 , 9 , 8 , 7 , 6 , 2 , 1 { ; } 10 , 9 , 8 , 7 , 6 , 5 , 1 { = = = B A B A
} 5 , 4 , 3 , 2 { = B A
(d) } 10 , 9 , 8 , 7 , 6 , 4 , 3 , 2 , 1 { ) ( } 5 { ) ( = = C B C B
} 10 , 9 , 8 , 7 , 6 , 5 , 1 { ) ( } 4 , 3 , 2 { ) ( = = C B A C B A
(e) } 10 , 9 , 8 , 7 , 6 , 5 , 2 , 1 { ) ( } 4 , 3 { ) ( } 7 , 6 , 5 , 4 , 3 { ) ( = = = C B A C B A C B

Exerccios:
Suponha que }. 2 0 | { s s = x x S Sejam os conjuntos A e B definidos da forma
seguinte: . } 2 / 3 4 / 1 | { } 1 2 / 1 | { < s = s < = x x B e x x A Descreva os seguintes
conjuntos:
(a) B A (b) B A (c) B A (d) B A

Princpios Bsicos da Teoria da Probabilidade
Quando um experimento realizado, o resultado um elemento do espao amostral.
Se o experimento for realizado algumas vezes, podero ocorrer diferentes resultados a
cada vez ou alguns resultados podem se repetir. Esta freqncia de ocorrncias de
um resultado pode ser considerada como uma probabilidade. Resultados mais
provveis ocorrem com maior freqncia.
Seja A um evento associado ao Espao Amostral S. Ento definimos:
S em possiveis casos de numero
A a favoraveis casos de numero
A P = ) (
Esta a definio clssica de probabilidade quando S finito, e baseia-se no conceito
de resultados equiprovveis.
Considere o exemplo escolher um ponto do circulo unitrio centrado na origem. Nesse
caso diremos que os eventos sero equiprovveis se eles tem a mesma rea. Essa
interpretao conduz a definio, para A c S,
t
A de area
S de area
A de area
A P = = ) (
Esta probabilidade chamada de Geomtrica.
Acontece que nem todo subconjunto de S tem uma rea bem definida. Dessa forma s
iremos atribuir probabilidade aos eventos cuja rea estiver bem definida.
Oura possvel interpretao a considerada subjetiva, pela qual, em vez de pensar na
probabilidade como freqncia, pensamos como se fosse uma crena na possibilidade
de ocorrncia de um evento.


8

Fundamentos Axiomticos
Para cada evento A no espao amostral S queremos associar a A um nmero entre
zero e um que ser chamado de probabilidade de A, denotado por P(A).
Definio: Uma famlia de subconjuntos de S chamada de sigma lgebra (o-lgebra
ou campo de Borel), denotada por B, se satisfizer as trs seguintes propriedades:
a. | e B (o conjunto vazio um elemento de B).
b. A e B, ento A
c
e B ( B fechado, sob complementao).
c. Se A
1
, A
2
, ......e B ento

=
e
1 i
i
A B( B fechado, sob unies contveis).
O conjunto vazio | um subconjunto de qualquer conjunto. Portanto, | c S. A
propriedade (a) estabelece que este subconjunto esta sempre em uma sigma lgebra.
Como S = |
c
, as propriedades (a) e (b) implicam que S tambm est sempre em B.
Alm disso, a partir das Leis DeMorgan, segue que B fechado sob intersees
contveis. Se A
1
, A
2
, ......e B, ento e ,.... ,
2 1
c c
A A B pela propriedade (b) e, portanto,

=
e
1 i
c
i
A B. Entretanto, utilizando a Lei DeMorgan, temos

=
=
|
|
.
|

\
|
1 1 i
i
c
i
c
i
A A
Assim, novamente pela propriedade (b),

=1 i
i
A e B.

Exemplo: Se S tem n elementos, existem 2
n
conjuntos em . Seja: S = {1, 2, 3}, ento
B a seguinte seqncia de 2
3
= 8 conjuntos:
{} { } { } { } { } { } { } { } 3 , 2 , 1 , 3 , 2 , 3 , 1 , 2 , 1 , 3 , 2 , 1 , | =

Exemplo: Seja: S = (-, ) a reta real, ento escolhido para conter todos os
conjuntos da forma [a,b], (a,b], [a,b) e (a,b) para todos os nmeros reais a e b.
Podemos deduzir que contem todos os conjuntos que podem ser formados ao se
considerarem unies e intersees de conjuntos das variveis acima.
Agora estamos em condies de definir uma funo de probabilidade.

Definio: Levando em conta um espao amostral S e uma sigma lgebra associada B,
uma funo de probabilidade uma funo P com domnio Bque satisfaz
1. P(A) 0 para todo A e B.
2. P(S) = 1.
3. Se A
1
, A
2
, ......e Bforem disjuntos dois a dois, ento

=
=
|
|
.
|

\
|
1 1 i
i
i
i
A A P

.

9

As trs propriedades desta definio so, geralmente, chamadas de Axiomas de
Probabilidade ( ou Axiomas de Kolmogorov, em homenagem a A. Kolmogorov, um dos
pais da teoria da probabilidade).

Teorema: Seja S={s
1
,......,s
n
} um conjunto finito. Seja Bqualquer sigma lgebra de
subconjuntos de S. Sejam p
1
,.....,p
n
nmeros no negativos que soma 1. Para qualquer
A e B, definimos P(A) por

e
=
} ; {
) (
A s i
i
i
p A P

Axioma da Aditividade Finita: Se A eBe B e Bso disjuntos, ento
) ( ) ( ) ( B P A P B A P + =

Teorema: Se P uma funo de probabilidade e A qualquer conjunto em B , ento
a. vazio conjunto o onde P C = C , 0 ) (
b. 1 ) ( s A P
c. ) ( 1 ) ( A P A P
c
=
Prova:
mais fcil provar (c) em primeiro lugar. Os conjuntos A e A
c
formam uma partio do
espao amostral, isto
c
A A S = . Portanto,
1 ) ( ) ( = = S P A A P
c

Alm disso, A e A
c
so disjuntos, portanto,
) ( ) ( ) (
c c
A P A P A A P + =
E combinando estes resultados temos ) ( 1 ) ( ) ( ) ( 1 A P A P A P A P
c c
= + =
Como P(A
c
) 0 temos que P(A) 1.
Sabemos que C = S S e temos que disjuntos so e S C , ento
) ( ) ( ) ( ) ( 1 C + = C = = P S P S P S P
E, portanto, 0 ) ( = C P

Teorema: Se P uma funo de probabilidade e A e B so quaisquer conjuntos em B,
ento
a. ) ( ) ( ) ( B A P B P A B P
c
=
b. ) ( ) ( ) ( ) ( B A P B P A P B A P + =
c. ) ( ) ( , B P A P ento B A Se s c
Prova:

10

Para quaisquer conjuntos A e B temos
) ( ) (
c
A B A B B =
E, portanto, para ) ( ) (
c
A B e A B disjuntos, temos
) ( ) ( ) ( ) ( ) ( ) ( A B P B P A B P A B P A B P B P
c c
= + =
Comprovando (a).
Para estabelecer (b), utilizamos a identidade
) (
c
A B A B A =
E, portanto, para ) (
c
A B e A disjuntos, temos
) ( ) ( ) ( ) ( ) ( ) ( B A P B P A P A B P A P B A P
c
+ = + =
A partir de (a).
Por fim, se . , A B A ento B A = c Portanto, utilizando (a), temos
) ( ) ( ) ( ) ( ) ( ) ( ) ( 0 A P B P A P B P B A P B P A B P
c
> = = s
Estabelecendo (c).
A frmula ) ( ) ( ) ( ) ( B A P B P A P B A P + = resulta em uma desigualdade til
para a probabilidade de uma interseo. Como 1 ) ( s B A P , temos depois de fazer
alguns rearranjos,
1 ) ( ) ( ) ( + > B P A P B A P
Esta desigualdade um caso especial daquilo que conhecido como Desigualdade de
Bonferroni, permitindo limitar a probabilidade de um evento simultneo (interseo)
em termos das probabilidades dos eventos individuais.
Exemplo: A desigualdade de Bonferroni particularmente til quando difcil (ou
mesmo impossvel) calcular a probabilidade de interseo, mas importante ter
alguma idia do tamanho desta probabilidade. Suponha que A e B sejam dois eventos
e que cada um tenha probabilidade de 0,95. Ento, a probabilidade que ocorrer
limitada inferiormente por
90 , 0 1 95 , 0 95 , 0 1 ) ( ) ( ) ( = + = + > B P A P B A P

Teorema: Se P uma funo de probabilidade, ento
a. ,....... , ) ( ) (
2 1
1
C C partio qualquer para C A P A P
i
i
=

=

b. ( ) ,....... , ) (
2 1
1 1
A A conjuntos quaisquer para A P A P
i
i i
i

=
=


(Desigualdade de Boole)
Prova: Como C
1
, C
2
,....... formam uma partio, sabemos que C =
j i
C C para todo i
j, e .
1
i
i
C S

=
= Assim,
( )

=
= = =
1 1
) (
i
i
i
i
C A C A S A A

11

Onde a ultima igualdade segue a partir da Lei Distributiva. Portanto, temos
( )

=
=
1
) ( ) (
i
i
C A P A P
Agora, uma vez que C
i
so disjuntos, os conjuntos
i
C A tambm o so, e a partir
das propriedades de uma funo de probabilidade, temos
( ) ) ( ) (
1 1
i
i i
i
C A P C A P =


estabelecendo (a).
Para estabelecer (b) , primeiramente criamos uma seqncia disjunta ,..... ,
*
2
*
1
A A ,
com a propriedade
i
i
i
i
A A


=

=
=
1
*
1
. Definimos
*
i
A por
( ) ,.... 3 , 2 , ,
1
1
*
1
*
1
= = =

=
i A A A A A
j
i
j
i i

onde a notao A|B denota a parte de A que no intersecta com B. Em smbolos mais
familiares,
c
B A B A = | . Ser fcil perceber que
i
i
i
i
A A


=

=
=
1
*
1
e, portanto,
temos
( ) ( ) ) (
*
1 1
*
1
i
i i
i
i
i
A P A P A P

=
= =


onde a ltima igualdade segue, uma vez que
*
i
A so disjuntos. Para verificar isto,
escrevemos
( ) { } ( ) { } ) ( | |
*
1
1
1
1
* *
i
k
j
j k
i
j
j i k i
A de definio A A A A A A


=

=
=
( ) ( ) ) |" " (
1
1
1
1
de definio A A A A
c
k
j
j k
c
i
j
j i
)
`


)
`

=

=

=


( ) { } ( ) { } ) (
1
1
1
1
DeMorhgan Leis A A A A
c
j
k
j
k
c
j
i
j
i

=

=
=
Agora, se i > k, a primeira interseo, acima, estar contida no conjunto
c
k
A , que ter
uma interseo vazia com A
k
. Se k > i, o argumento similar. Alm disso, pela
construo
i i
A A c
*
, portanto, temos A P A P
i i
), ( ) (
*
s
) ( ) (
1
*
1
i
i
i
i
A P A P


=

=
s
estabelecendo (b).

Contagem
A contagem de problemas, em geral, parece complicada, e frequentemente
precisamos manter nossa contagem sujeita a muitas restries. O meio de resolver
esses problemas dividi-los em uma srie de tarefas simples, que so fceis de serem
contadas, e empregar regras conhecidas de combinao de tarefas. O teorema a seguir
a primeira etapa neste processo e, algumas vezes, conhecido como Teorema
Fundamental da Contagem.


12

Teorema: Se um trabalho consiste em k tarefas separadas, a i-sima delas pode ser
realizada de n
i
maneiras, i= 1, 2,...., k, ento o trabalho todo pode ser realizado de
n
1
x n
2
x .... x n
k
modos.

Exemplo: Considere uma loteria de 44 nmeros onde iremos escolher os 2 primeiros
nmeros sorteados. Desta forma o primeiro nmero pode ser escolhido de 44
maneiras, e o segundo nmero, de 43 maneiras, perfazendo um total de 44 x 43 =1892
modos de escolher os dois nmeros. Contudo se uma pessoa pode escolher o mesmo
nmero duas vezes, teremos 44 x 44 = 1935 maneiras.


Definio: Para um nmero inteiro positivo n, n! (leia-se n fatorial) o produto de
todos os nmeros inteiros positivos menores ou iguais a n. Isto :
n! = n x (n-1) x (n-2) x .....x 3 x 2 x 1
Alm disso, definimos 0! = 1.

Considere o exemplo anterior da loteria de 44 nmeros onde iremos sortear seis
nmeros.

1. Ordenados, sem reposio Pelo Teorema Fundamental da Contagem, o primeiro
pode ser selecionado de 44 maneiras, o segundo de 43 maneiras , etc. Assim,
existem
440 . 517 . 082 . 5
! 38
! 44
39 40 41 42 43 44 = = x x x x x
possveis bilhetes.

2. Ordenados, com reposio Uma vez que cada nmero pode ser selecionado de
44 maneiras, existem
856 . 313 . 256 . 7 44 44 44 44 44 44 44
6
= = x x x x x
possveis bilhetes.

3. No ordenados, sem reposio Conhecemos o nmero de possveis bilhetes,
com a ordenao sendo levada em conta, de modo que devemos dividir as
ordenaes redundantes. Mais uma vez, a partir do Teorema Fundamental da
Contagem, seis nmeros podem ser arranjados de 6 x 5 x 4 x 3 x 2 x 1 maneiras de
modo que o nmero total de bilhetes no ordenados
052 . 059 . 7
! 38 ! 6
! 44
1 2 3 4 5 6
39 40 41 42 43 44
= =
x x x x x
x x x x x

possveis bilhetes.


Resumo dos possveis ordenaes de tamanho r de n objetos
Sem Reposio Com Reposio
Ordenado
)! (
!
r n
n


r
n
No Ordenado
)! ( !
!
r n r
n
r
n

=
|
|
.
|

\
|

|
|
.
|

\
| +
r
r n 1




13





Probabilidade Condicional e Independncia

Definio: Se A e B so eventos em S e P(B) > 0, ento a probabilidade condicional de A
dado B, escrita como ) | ( B A P ,

) (
) (
) | (
B P
B A P
B A P

=
Observe que o que acontece no clculo da probabilidade condicional que B se torna
o espao amostral: . 1 ) | ( = B B P A intuio de que o nosso espao amostral original,
S, foi atualizado para B.

Reexpressar a frmula anterior resulta em uma forma til de calcular probabilidades
de interseo,
) ( ) | ( ) ( B P B A P B A P =
utilizando a simetria da frmula podemos escrever
) ( ) | ( ) ( A P A B P B A P =
e, da mesma forma, igualando os dois lados dessas equaes podemos obter

) (
) (
) | ( ) | (
B P
A P
A B P B A P =
A equao acima geralmente chamada de Regra de Bayes, em homenagem ao seu
descobridor, Sir Thomas Bayes.


Regra de Bayes
Suponhamos que A
1
, A
2
,..... seja uma partio do especo amostral, e que B seja um
conjunto qualquer. Ento, para cada i=1,2,.......,


) ( ) | (
) ( ) | (
) | (
1
j j
j
i i
i
A P A B P
A P A B P
B A P

=
=

Exemplo: Quando mensagens codificadas so enviadas, algumas vezes ocorrem erros
de transmisso. Em particular, o cdigo Morse utiliza pontos e traos, que, como
se sabe, ocorrem na proporo de 3:4. Isto significa que para qualquer smbolo dado,

7
3
) ( = enviado ponto P e
7
4
) ( = enviado trao P
Suponha que exista uma interferncia na linha de transmisso, e com uma
probabilidade 1/8, um ponto, erroneamente, recebido como um trao e vice-versa.
Se recebemos um ponto, podemos ter certeza de que realmente foi enviado um
ponto?

Utilizando a regra de Bayes, podemos escrever
) (
) ( ) | (
) | (
recebido ponto P
enviado ponto P enviado ponto recebido ponto P
recebido ponto enviado ponto P
=
=


14


Agora, a partir da informao dada, sabemos que

7
3
) ( = enviado ponto P e
8
7
) | ( = enviado ponto recebido ponto P

Alm disso, tambm podemos escrever

=
+ =
) (
) ( ) (
enviado ponto recebido ponto P
enviado ponto recebido ponto P recebido ponto P


=
+ =
) ( ) (
) ( ) | (
enviado trao P enviado trao recebido ponto P
enviado ponto P enviado ponto recebido ponto P


56
25
7
4
.
8
1
7
3
.
8
7
= + =

Combinando esses resultados, temos que a probabilidade de receber corretamente um
ponto
( )( )
( )
25
21
) | (
56 / 25
7 / 3 8 / 7
= = recebido ponto enviado ponto P


Definio: Dois eventos, A e B, so estatsticamente independentes se

) ( ) ( ) ( B P A P B A P =

A independncia de A e B implica tambm a independncia dos complementos.


Teorema: Se A e B so eventos independentes, ento, os seguintes pares tambm so
independentes:
a. A e B
c

b. A
c
e B
c. A
c
e B
c


Prova:
a.
) ( ) ( )) ( 1 )( (
) ( ) ( ) ( ) ( ) ( ) (
c
c
B P A P B P A P
B P A P A P B A P A P B A P
= =
= = =

O restante, (b) e (c), podem ser resolvidos como exerccios.


Definio: Uma seqncia de eventos A
1
,......A
n
mutuamente independente se para
qualquer subseqncia
k
i i
A A ., ,.........
1
tivermos
( )
[
= =
=
k
j
i
k
j
i
j j
A P A P
1 1
) (


Exemplo: Lanamento de dois dados


15

Um experimento consiste em lanar dois dados. Para esse experimento o espao
amostral
)}; 6 , 6 ( ),......., 1 , 6 ( , ),........ 6 , 1 ( ),....., 2 , 1 ( ), 1 , 1 {( = S
Ou seja, S consiste nos 36 pares ordenados formados a partir dos nmeros de 1 a 6.
Defina os seguintes eventos:
)}, 6 , 6 ( ), 5 , 5 ( ), 4 , 4 ( ), 3 , 3 ( ), 2 , 2 ( ), 1 , 1 {( } { = = duplos ocorrem A
}, 10 7 { e entre esta soma a B =
}. 8 7 2 { ou ou soma a C =
As probabilidades podem ser calculadas pela contagem entre os 36 resultados
possveis. Temos P(A)=1/6, P(B)=1/2 e P(C)=1/3.
Alm disso,
) ( ) ( ) (
3
1
.
2
1
.
6
1
36
1
} 4 , 8 { ) (
C P B P A P
s duplos de composta soma a C B A P
= =
= = =


Contudo ) ( ) (
36
11
} 8 7 { ) ( C P B P ou a Igual soma a C B P = = =
De modo similar, pode ser de mostrado que ) ( ) ( ) ( B P A P B A P = ; portanto a
exigncia ) ( ) ( ) ( ) ( C P B P A P C B A P = no uma condio suficientemente
forte para assegurar a independncias duas a duas.

Exemplo: A probabilidade de fechamento de cada rel do circuito apresentado na
figura abaixo dada por p. Se todos os rels funcionarem independentemente, qual
ser a probabilidade de que haja corrente entre os terminais L e R?

Seja A
i
o evento {o rel i esta fechado}, i=1,2,3,4. Represente por E o evento {a
corrente passa de L para R}. Em conseqncia, ). ( ) (
4 3 2 1
A A A A E = Observe
que ) ( ) (
4 3 2 1
A A e A A no so mutuamente excludentes. Portanto,
= + = ) ( ) ( ) ( ) (
4 3 2 1 4 3 2 1
A A A A P A A P A A P E P

4 2 4 2 2
2 p p p p p = + =

Exemplo: Suponha que, numa famlia com duas crianas, a probabilidade do filho estar
gripado 40% (P(H)=0,40) e a probabilidade da filha estar gripada 60% (P(M)=0,60).
possvel calcular a probabilidade de ambos estarem gripados?
Se supusermos que estes dois eventos so independentes, ento simples:
24 , 0 ) 60 , 0 )( 40 , 0 ( ) ( ) ( ) ( = = = M P H P M H P = 24%. Mas ser que esta suposio
razovel? Afinal, se um deles estiver gripado, imagina-se que a probabilidade do
outro estar gripado aumenta. Matematicamente falando, acreditamos que
%, 40 ) ( ) | ( = > H P M H P e a probabilidade condicional que teria de ser usada:
) ( ) | ( ) ( M P M H P M H P =
Sem mais dados no possvel resolver o problema.


16

Exemplo: Por outro lado, se no problema anterior forem dados
3 , 0 ) ( 6 , 0 ) ( , 4 , 0 ) ( = = = M H P e M P H P , possvel verificar se os eventos H e
M so independentes. Outras maneiras de chegar a mesma concluso:
) ( 4 , 0 5 , 0
6 , 0
3 , 0
) | ( H P M H P = > = =
) ( 6 , 0 75 , 0
4 , 0
3 , 0
) | ( M P H M P = > = =
Neste caso, diz-se que o evento H atrai o evento M ou que os eventos so
positivamente associados.

Exemplo: Professor Ronaldo (Matemtica) esta na RURAL 70% do horrio comercial,
enquanto o Professor Macrini (Estatstica) esta na RURAL 20% do horrio comercial.
Sabe-se tambm que, em 20% do horrio comercial , nenhum dos dois esta presente
na RURAL. Os eventos Professor Ronaldo esta na RURAL e Professor Macrini esta
na RURAL so independentes?

Podemos montar a seguinte tabela com os dados do problema:

R R
c
Total
M 0,20
M
c
0,20
Total 0,70 1,0

Completando a tabela a la Sudoku temos:

R R
c
Total
M 0,10 0,10 0,20
M
c
0,60 0,20 0,8
Total 0,70 0,30 1,0

Como 5 , 0
20 , 0
10 , 0
) | ( 70 , 0 ) ( = = = = M R P R P os eventos no so independentes.

Exemplo: Quantas vezes, no mnimo, se deve lanar um dado para que a probabilidade
de obter algum seis seja superior a 90%?
Seja n o nmero de lanamentos. A probabilidade de no obter
nenhum seis :

n
|
.
|

\
|
6
5

Queremos 629 . 12
6
5
ln
) 1 . 0 ( ln
1 . 0
6
5
=
|
.
|

\
|
> <
|
.
|

\
|
n
n

Ou seja, devemos lanar a dado 13 vezes.


Variveis Aleatrias
Ao descrever o espao amostral de um experimento, no especificamos que
um resultado individual necessriamente seja um nmero. De fato, apresentamos

17

alguns exemplos nos quais os resultados do experimento no eram uma quantidade
numrica. Por exemplo, ao descrever uma pea manufaturada, podemos empregar
apenas as categorias defeituosa e no defeituosa. Tambm, ao observar a
temperatura durante o perodo de 24 horas, podemos simplesmente registrar a curva
traada pelo tomgrafo. Contudo, em muitas situaes experimentais, estaremos
interessados na mensurao de alguma coisa e no seu registro como nmero. Mesmo
nos casos mencionados acima, poderemos atribuir um nmero a cada resultado (no
numrico) do experimento. Por exemplo, poderemos atribuir o valor um as peas
perfeitas e o valor zero as peas defeituosas. Poderemos registrar a temperatura
mxima do dia, ou a temperatura mnima, ou a mdia das temperaturas mxima e
mnima.


Definio: Sejam c um experimento e S um espao amostral associado ao
experimento. Uma funo X, que associe a cada elemento s e S um nmero real, X(s),
denominada varivel aleatria.

Exemplo: Considere o experimento de lanar uma moeda equilibrada trs vezes.
Defina a varivel aleatria X como sendo o nmero de vezes que saiu cara nos trs
lanamentos. Uma enumerao completa do valor de X para cada ponto no espao
amostral :

s CaCaCa CaCaCo CaCoCa CoCaCa CoCoCa CoCaCo CaCoCo CoCoCo
X(s) 3 2 2 2 1 1 1 0

O conjunto de valores para a varivel aleatria X }. 3 , 2 , 1 , 0 { = _ Assumindo que
todos os oito pontos em S tem a probabilidade de 1/8, simplesmente fazendo a
contagem, no diagrama anterior, vemos que a funo de probabilidade induzida em
_ dada por
x 0 1 2 3
P(X=x) 1/8 3/8 3/8 1/8

Por exemplo, . 8 / 3 }) , , ({ ) 1 ( = = = CoCoCa CoCaCo CaCoCo P X P


Funes de Distribuio

Definio: A funo de distribuio acumulada, ou fda, de uma varivel aleatria X,
denotada por F(x), definida por
), ( ) ( x X P x F s = para todo x.

Exemplo: Considere o experimento de lanar uma moeda equilibrada trs vezes.
Defina a varivel aleatria X como sendo o nmero de vezes que saiu cara nos trs
lanamentos. A fda de X :

< s
< s
< s
< s
< <
=
x se
x se
x se
x se
x se
x F
3 1
3 2 8 / 7
2 1 8 / 4
1 0 8 / 1
0 0
) (

18


A funo escada F(x) representada na figura abaixo.



Existem vrios pontos a ser observados na figura acima. F(x) definido para todos os
valores de x, no somente para aqueles em }. 3 , 2 , 1 , 0 { = _ Desse modo, por
exemplo,
8 / 7 ) 2 1 , 0 ( ) 5 , 2 ( ) 5 , 2 ( = = = s = ou X P X P F
Observe que F(x) tem saltos nos valores de _ e
i
x e que o tamanho do salto em x
i

igual a P(X=x
i
). Alm disso, F(x)=0 para x<0, uma vez que X, nesse caso, no pode ser
negativo, e F(x)=1 para x3, uma vez que x certamente menor ou igual a esse valor,
neste caso.


Teorema: Uma funo F(x) uma fda se, e somente se, forem obedecidas as trs
seguintes condies:
a. . 1 ) ( lim 0 ) ( lim = =

x F e x F
x x

b. F(x) uma funo no decrescente de x.
c. F(x) contnua direita; isto , para cada nmero x
0
,
). ( ) ( lim
0
0
x F x F
x x
=



Exemplo: Lanamento de moeda at obter cara
Suponha que faamos um experimento que consiste em lanar uma moeda at que o
resultado seja cara. Digamos que p = probabilidade de obter cara em qualquer
lanamento, e definimos uma varivel aleatria X = nmero de lanamentos
requeridos para se obter uma cara. Ento. Para qualquer x = 1,2,.......
, ) 1 ( ) (
1
p p x X P
x
= =
Uma vez que obtemos x-1 coroas seguidas por uma cara para que o evento ocorra e
todas as tentativas so independentes. A partir da expresso anterior calculamos, para
qualquer nmero inteiro positivo x,
, ) 1 ( ) ( ) (
1
1 1
p p i X P x X P
i
x
i
x
i

= =
= = = s



Sabemos que a soma parcial da srie geomtrica dada por
, 1 ,
1
1
1
1
=

t
t
t
t
n n
k
k


Logo, teremos
,.... 2 , 1 , ) 1 ( 1
) 1 ( 1
) 1 ( 1
) ( ) ( = =


= s = x p p
p
p
x X P x F
x
x



19

A fda F(x) constante entre nmeros inteiros no negativos. fcil de mostrar que
se 0 < p < 1, ento F(x) satisfaz as condies do teorema anterior. Primeiro,
0 ) ( lim =

x F
x

Uma vez que F(x) = 0 para todo x < 0, e
, 1 ) 1 ( 1 lim ) ( lim = =

x
x x
p x F

Onde x assume apenas valores inteiros quando este limite definido. Para verificar a
propriedade (b) do teorema, simplesmente observe que a soma contm mais termos
positivos a medida que x aumenta. Por fim, para verificar a propriedade (c) do
teorema, observe que, para quaisquer x, 0 ) ( ) ( > = + c c se x F x F for
suficientemente pequeno. Portanto,
), ( ) ( lim
0
x F x F = +

c
c

De modo que F(x) contnuo a direita.


Definio: Uma varivel aleatria X contnua se F(x) for uma funo contnua de x.
Uma varivel aleatria X discreta se F(x) for uma funo escada de x.

Definio: As variveis aleatrias X e Y so identicamente distribudas se, para cada
conjunto , B e A ). ( ) ( A Y P A X P e = e
Observe que duas variveis aleatrias que so identicamente distribudas no
so necessariamente iguais. Isto , a definio anterior no diz que X = Y.

Exemplo: Variveis aleatrias identicamente distribudas
Considere o experimento de lanar uma moeda equilibrada trs vezes. Defina s
variveis aleatrias X e Y por
X = nmero de caras observado e Y = nmero de coroas observado
A distribuio de X e Y so exatamente a mesma. Isto , para cada k=0, 1, 2, 3, temos
P(X = k) = P(Y = k). Portanto X e Y so identicamente distribudas. Contudo, em nenhum
dos pontos amostrais temos X(s) = Y(s).


Funes Densidades e de Probabilidade
Associado com uma varivel aleatria X e sua fda F(x) existe uma outra funo,
chamada de funo densidade de probabilidade (f.d.p.) ou funo de probabilidade
(f.p.). Os termos f.d.p. e f.p. se referem, respectivamente, aos casos contnuos e
discretos.


Definio: A funo de probabilidade (f.p.) de uma varivel aleatria discreta X dada
por
. ) ( ) ( x todo para x X P x f = =

Exemplo: Vimos que para o experimento lanamento de moeda at obter cara temos
a f.p.

=
= = =
contrrio caso
x para p p
x X P x f
x
0
,... 2 , 1 ) 1 (
) ( ) (


20

Podemos utilizar a f.p. para calcular probabilidades. Uma vez que agora podemos
medir a probabilidade de um ponto nico, precisamos somente som-las em todos os
pontos do evento apropriado. Portanto, para nmeros inteiros positivos a e b, com a
b, temos
. ) 1 ( ) ( ) (
1
p p k f b X a P
k
b
a k
b
a k

= =
= = s s


No caso discreto, podemos somar os valores da f.p. para obter a fda. O procedimento
anlogo no caso contnuo substituir as somas por integrais, e obtemos

}

= = s
x
dt t f x F x X P ) ( ) ( ) (

Utilizando o Teorema Fundamental do Clculo, se f(x) for contnua, temos a seguinte
relao
). ( ) ( x f x F
dx
d
=


Definio: A funo densidade de probabilidade ou f.d.p., f(x), de uma varivel
aleatria contnua X a funo que satisfaz

}

=
x
x todo para dt t f x F . ) ( ) (

No caso contnuo, podemos ser mais diretos sobre a especificao das probabilidades
de intervalos. Como P(X = x) = 0 se X uma varivel aleatria contnua,
) ( ) ( ) ( ) ( b X a P b X a P b X a P b X a P s s = < s = s < = < <

Exemplo: Considere a seguinte funo de distribuio acumulada dada por
0 ,
1
1
) ( >
+
=

x
e
x F
x

E, portanto,
.
) 1 (
) ( ) (
2 x
x
e
e
x F
dx
d
x f

+
= =

Na verdade, existem somente duas exigncias para uma f.d.p. (ou f.p.), e ambas so
conseqncias imediatas da definio.


Teorema: Uma funo f(x) uma f.d.p. (ou f.p.) de uma varivel aleatria X se, e
somente se,
a. x todo para x f 0 ) ( >
b. ) ( 1 ) ( ) ( 1 ) ( fdp dx x f ou fp x f
x
= =
}






Valores Esperados
O valor esperado, ou a expectncia, de uma varivel aleatria meramente seu valor
mdio, em que nos referimos a um valor mdio como aquele que avaliado de
acordo com a distribuio de probabilidade. O valor esperado pode ser entendido
como uma medida central, assim como pensamos em mdias como sendo valores

21

mdios. Ponderando os valores da varivel aleatria de acordo com a distribuio de
probabilidade, esperamos obter um nmero que possa resumir um valor tpico ou
esperado de uma observao da varivel aleatria.
Definio: O valor esperado ou mdia de uma varivel aleatria g(X), denotado por
Eg(X), :

= =
=

}
e e


discreto for X se x X P x g x f x g
contnuo for X se dx x f x g
X Eg
X x X x
) ( ) ( ) ( ) (
) ( ) (
) (

Exemplo: Seja X uma varivel aleatria com funo de probabilidade dada por:
n x p p
x
n
x X P x f
x n x
,.... 2 , 1 , 0 , ) 1 ( ) ( ) ( =
|
|
.
|

\
|
= = =


Onde n um nmero inteiro positivo, 0 p 1, e para cada par fixo n e p a f.p. soma 1.
O valor esperado desta varivel aleatria dado por:

x n x
n
x
x n x
n
x
p p
x
n
x p p
x
n
x EX

=

=

|
|
.
|

\
|
=
|
|
.
|

\
|
=

) 1 ( ) 1 (
1 0


(em x = 0 o termo 0). Utilizando a identidade
|
|
.
|

\
|

=
|
|
.
|

\
|
1
1
x
n
n
x
n
x , temos
=
|
|
.
|

\
|

=

=

x n x
n
x
p p
x
n
n EX ) 1 (
1
1
1

=
|
|
.
|

\
|
=
+ +

) 1 ( 1
1
0
) 1 (
1
y n y
n
y
p p
y
n
n (substitua y = x 1)
=
|
|
.
|

\
|
=

y n y
n
y
p p
y
n
n np
1
1
0
) 1 (
1


uma vez que a ltima soma deve ser 1, sendo a soma de todos os valores possveis de
uma funo de probabilidade.

Propriedades do valor esperado:
a. . tan , ) ( te cons uma k sendo k k E =
k k x p k x kp k E
i
n
x
i
n
x
= = = =

= =
1 . ) ( ) ( ) (
1 1

b. . tan ), ( ) ( te cons uma k sendo X kE kX E =
) ( . ) ( ) ( ) (
1 1
X E k x p x k x p kx kX E
i i
n
x
i i
n
x
= = =

= =

c. . tan , ) ( ) ( tes cons b e a sendo b X aE b aX E =


Definio: Para cada nmero inteiro n, o n-simo momento de X,
'
n
,
). (
' n
n
X E =
O n-simo momento central de X,
n
,
. ) (
n
n
X E =


22

Definio: A varincia de uma varivel aleatria X seu segundo momento central,
. ) ( ) (
2
EX X E X V = A raiz quadrada positiva de V(X) o desvio padro de X.

Deduzindo a frmula acima podemos escrever:
= + = = )) ( ) ( 2 ( )) ( ( ) (
2 2 2
X E X XE X E X E X E X V

= + = + = ) ( ) ( 2 ) ( ) ( ) ( ) ( 2 ) (
2 2 2 2 2
X E X E X E X E X E X E X E
) ( ) (
2 2
X E X E =

A varincia da uma medida do grau de disperso de uma distribuio ao redor
de sua mdia. O desvio padro mais fcil de ser interpretado, no sentido de que a
unidade de medida no desvio padro a mesma que para a varivel original X. A
unidade de mediada na varincia o quadrado da unidade original.


Definio: A covarincia mede o grau de dependncia entre duas variveis aleatrias
X e Y.
| || | { } ) ( . ) ( ) , ( Y E Y X E X E Y X COV =
| | { } ) ( ) ( ) ( ) ( Y E X E X YE Y XE XY E + =
) ( ) ( ) ( ) ( ) ( ) ( ) ( Y E X E X E Y E Y E X E XY E + =
) ( ) ( ) ( Y E X E XY E =
Se X e Y forem independentes temos ) ( ) ( ) ( Y E X E XY E = ento
0 ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) , ( = = = Y E X E Y E X E Y E X E XY E Y X COV

Propriedades da Varincia:
1. V(k) = 0, sendo k uma constante
| | { } | | { } 0 ) ( ) (
2 2
= = = k k E k E k E k V

2. ), ( ) (
2
X V k kX V = sendo k uma constante
| | { } | | { }= = =
2 2
) ( ) ( ) ( X kE kX E kX E kX E kX V
| | { } | | { } ) ( ) ( ) (
2 2 2 2 2
X V k X E X E k X E X k E = = =

3. ) , ( 2 ) ( ) ( ) ( Y X COV Y V X V Y X V + =
{ }= + + = +
2
)] ( ) [( ) ( Y X E Y X E Y X V
{ }= + =
2
))] ( ( )) ( [( Y E Y X E X E
{ }= + + = )] ( )( ( ( 2 )) ( ( )) ( [(
2 2
Y E Y X E X Y E Y X E X E
= + + = )] ( ) ( [ 2 )) ( ( )) ( (
2 2
Y E X E XY E Y E Y E X E X E
= + + = )] ( ) ( ) ( [ 2 )) ( ( )) ( (
2 2
Y E X E XY E Y E Y E X E X E
) , ( 2 ) ( ) ( Y X COV Y V X V + + =

{ }= =
2
)] ( ) [( ) ( Y X E Y X E Y X V
{ }= =
2
))] ( ( )) ( [( Y E Y X E X E
{ }= + = )] ( )( ( ( 2 )) ( ( )) ( [(
2 2
Y E Y X E X Y E Y X E X E
= + = )] ( ) ( [ 2 )) ( ( )) ( (
2 2
Y E X E XY E Y E Y E X E X E

23

= + = )] ( ) ( ) ( [ 2 )) ( ( )) ( (
2 2
Y E X E XY E Y E Y E X E X E
) , ( 2 ) ( ) ( Y X COV Y V X V + =
4. ) , ( 2 ) ( ) ( ) (
2 2
Y X abCOV Y V b X V a bY aX V + =
a e b sendo constantes.
Como exerccio demonstre a propriedade.


Sabemos que se X e Y so independentes ento COV(X,Y) = 0. Logo,
) ( ) ( ) , ( 2 ) ( ) ( ) ( Y V X V Y X COV Y V X V Y X V
ind
+ + + = +
=

) ( ) ( ) , ( 2 ) ( ) ( ) ( Y V X V Y X COV Y V X V Y X V
ind
+ + =
=


Exemplo: Uma pessoa vende colhedeiras de milho. Visita semanalmente uma, duas ou
trs propriedades rurais com probabilidades 0.2, 5.5 e 0.3, respectivamente. De cada
contato pode conseguir a venda de uma colhedeira por R$ 120.000,00, com
probabilidade 0.3, ou nenhuma venda com probabilidade 0.7. Determinar o valor total
esperado (mdio) das vendas semanais.

0,3 V (0,2))0,3)(120.000) = 7.200
1
0,7 NV
0,2
0,5 0,3 V (0,5))0,3)(120.000) = 36.000
2
0,7 NV
0,3
0,3 V (0,3))0,3)(120.000) = 32.400
3
0,7 NV

E(X) = 7200 + 36000 + 32400 = 75.600

Exemplo: Seja X: renda familiar em R$ 1000,00 e Y: nmero de carros da famlia.
Considere o quadro:

X 2 3 4 2 3 3 4 2 2 3
Y 1 2 2 2 1 3 3 1 2 2

Calcular:
a) E(2X 3Y)
b) COV(X,Y)
c) V(5X 3Y)









24


















9 , 1 ) ( 8 , 2 ) ( = = Y E X E
49 , 0 61 , 3 1 , 4 ) ( 56 , 0 84 , 7 4 , 8 ) ( = = = = Y V X V
a) 1 , 0 ) ( 3 ) ( 2 ) 3 2 ( = = Y E X E Y X E
b) 28 , 0 ) ( ) ( ) ( ) ( = = Y E X E XY E XY COV
c) 01 , 10 ) , ( ) 3 )( 5 ( 2 ) ( 9 ) ( 25 ) 3 5 ( = + = Y X COV Y V X V Y X V


Variveis Aleatrias Mltiplas

Definio: Um vetor aleatrio n-dimensional uma funo de um espao amostral S
em 9
n
, o espao euclidiano n-dimensional.

Definio: Seja (X,Y) um vetor aleatrio discreto bivariado. Ento, a funo f(x,y) de
9
2
em 9 definida por f(x,y) = P(X = x, Y = y) chamada funo de probabilidade
conjunta ou f.p. conjunta de (X,Y).

A f.p. conjunta para qualquer vetor aleatrio discreto bivariado (X,Y) deve ter
determinadas propriedades. Para qualquer (x,y), f(x,y) 0, uma vez que f(x,y) uma
probabilidade. Alm disso, devemos ter:

9 e
= 9 e =
2
) , (
2
1 ) ) , (( ) , (
y x
Y X P y x f

A f.p. conjunta pode ser utilizada para calcular a probabilidade de qualquer evento
definido em termos de (X,Y). Seja A qualquer subconjunto de 9
2
. Ento


e
= e
A y x
y x f A Y X P
) , (
) , ( ) ) , ((
Valores esperados (expectncia) de funes de vetores aleatrios so calculados do
mesmo modo que as variveis aleatrias univariadas. Seja g(x,y) uma funo de real
valor, definida para todos os possveis valores (x,y) do vetor aleatrio discreto (X,Y).
Ento g(X,Y) , ela prpria, uma varivel aleatria, e seu valor esperado E(g(x,y))
dado por

9 e
=
2
) , (
) , ( ) , ( )) , ( (
y x
y x f y x g y x g E
Obs X X
2
Y Y
2
X Y
1 2 4 1 1 2
2 3 9 2 4 6
3 4 16 2 4 8
4 2 4 2 4 4
5 3 9 1 1 3
6 3 9 3 9 9
7 4 16 3 9 12
8 2 4 1 1 2
9 2 4 2 4 4
10 3 9 2 4 6
Total 28 84 19 41 56

25


Todas as propriedades vlidas para o caso univariado tambm so vlidas no caso n-
dimensional.

Exemplo: Considere a f.p. conjunta da tabela abaixo. Qual o valor mdio de XY?
Assumindo que g(x,y) = xy, calculamos E(XY) = E(g(x,y)) calculando xyf(x,y) para todos
os pontos da tabela. Deste modo

X



y
2 3 4 5 6 7 8 9 10 11 12
0 1/36 1/36 1/36 1/36 1/36 1/36
1 1/18 1/18 1/18 1/18 1/18
2 1/18 1/18 1/18 1/18
3 1/18 1/18 1/18
4 1/18 1/18
5 1/18

18
11
13
18
1
) 5 )( 7 (
18
1
) 4 )( 8 ( ....
36
1
) 0 )( 4 (
36
1
) 0 )( 2 ( ) ( )) , ( ( = + + + + = = XY E y x g E


Teorema: Seja (X,Y) um vetor aleatrio discreto bivariado, com f.p. conjunta f(x,y).
Ento, as funes de probabilidade marginais de X e Y, f(x) = P(X = x) e f(y) = P(Y = y),
so dadas por

= 9 e
= = = = = =
n
j
j i i
y
m i y Y x X P x X P ou y x f x f
1
,..., 2 , 1 ), , ( ) ( ) , ( ) (

= = = 9 e
= = = = = =
n
j
j i
m
i
m
i
i
y
y Y x X P x X P x f
1 1 1
1 ) , ( ) ( ) (


= 9 e
= = = = = =
m
i
j i j
x
n j y Y x X P y Y P ou y x f y f
1
,..., 2 , 1 ), , ( ) ( ) , ( ) (

= = = 9 e
= = = = = =
n
j
j i
m
i
n
j
j
x
y Y x X P j Y P y f
1 1 1
1 ) , ( ) ( ) (

Exemplo: Podemos calcular as distribuies marginais para X e Y a partir da
distribuio conjunta dada na tabela anterior:
6
1
) 0 , 12 ( ) 0 , 10 ( ) 0 , 8 ( ) 0 , 6 ( ) 0 , 4 ( ) 0 , 2 ( ) 0 ( = + + + + + = f f f f f f f
18
5
) 1 , 11 ( ) 1 , 9 ( ) 1 , 7 ( ) 1 , 5 ( ) 1 , 3 ( ) 1 ( = + + + + = f f f f f f
e de maneira similar,obtemos:
18
1
) 5 ( ,
9
1
) 4 ( ,
6
1
) 3 ( ,
9
2
) 2 ( = = = = f f f f

E observe que 1 ) 5 ( ) 4 ( ) 3 ( ) 2 ( ) 1 ( ) 0 ( = + + + + + f f f f f f , como deveria ser, uma
vez que estes so os nicos seis possveis valores de Y.


26

O mesmo raciocnio pode ser empregado na distribuio marginal de X. Faa como
exerccio.
Distribuies Condicionais e Independncia
Frequentemente, quando duas variveis aleatrias, (X,Y), so observadas, os valores
das duas variveis esto relacionadas. Por exemplo, suponha que, ao fazer a
amostragem de uma populao humana, X denote a altura de uma pessoa e Y denote
o seu peso. Conhecer o valor de X nos d algumas informaes sobre o valor de Y,
mesmo se no soubermos exatamente o valor de Y. Probabilidades condicionais
referentes a Y, dado que sabemos o valor de X, podem ser calculadas utilizando a
distribuio conjunta de (X,Y).


Definio: Seja (X,Y) um vetor aleatrio bivariado discreto, com f.p. conjunta f(x,y) e
f.p.s marginais f(x) e f(y). Para qualquer x de modo que P(X = x) = f(x) > 0, a f.p.
condicional de Y dado que X = x a funo de y denotada por f(y|x) e definida por

) (
) , (
) | ( ) | (
x f
y x f
x X y Y P x y f = = = =
Para qualquer y de modo que P(Y = y) = f(y) > 0, a f.p. condicional de X dado que Y = y
a funo de x denotada por f(x|y) e definida por

) (
) , (
) | ( ) | (
y f
y x f
y Y x X P y x f = = = =
Uma vez que chamamos (y|x) de f.p., deveramos verificar se esta funo de y na
verdade define uma f.p. para uma varivel aleatria. Primeiro, f(y|x) 0 para cada y
uma vez que f(x,y) 0 e f(x) 0. Segundo,
1
) (
) (
) (
) , (
) | ( = = =

x f
x f
x f
y x f
x y f
y
y

Portanto, f(y|x) ,na verdade, uma f.p. e pode ser utilizada da maneira usual para
calcular probabilidades envolvendo Y, uma vez que sabemos que X = x ocorreu.

Exemplo: Considere a f.p. conjunta de (X,Y) dada na tabela abaixo:


X
Y
10 20 30
0 2/18 2/18
1 3/18 4/18 3/18
2 4/18

As f.p. marginal de X dada por:

18
4
0
18
2
18
2
) 30 , 0 ( ) 20 , 0 ( ) 10 , 0 ( ) 0 ( = + + = + + = f f f f

18
10
18
3
18
4
18
3
) 30 , 1 ( ) 20 , 1 ( ) 10 , 1 ( ) 1 ( = + + = + + = f f f f

18
4
18
4
0 0 ) 30 , 2 ( ) 20 , 2 ( ) 10 , 2 ( ) 2 ( = + + = + + = f f f f
Logo 1
18
4
18
10
18
4
) ( = + + =

x f

As f.p. marginal de Y dada por:

27


18
5
0
18
3
18
2
) 2 , 10 ( ) 1 , 10 ( ) 0 , 10 ( ) 10 ( = + + = + + = f f f f
18
6
0
18
4
18
2
) 2 , 20 ( ) 1 , 20 ( ) 0 , 20 ( ) 20 ( = + + = + + = f f f f

18
7
18
4
18
3
0 ) 2 , 30 ( ) 1 , 30 ( ) 0 , 30 ( ) 30 ( = + + = + + = f f f f
Logo 1
18
7
18
6
18
5
) ( = + + =

y f

Para x = 0, as distribuies condicionais podem ser obtidas como:

) 0 (
) , 0 (
) 0 | (
f
y Y X f
y f
= =
= , ento


2
1
4
2
18 / 4
18 / 2
) 0 (
) 10 , 0 (
) 0 | 10 ( = = =
= =
=
f
Y X f
f

2
1
4
2
18 / 4
18 / 2
) 0 (
) 20 , 0 (
) 0 | 20 ( = = =
= =
=
f
Y X f
f
0
18 / 4
0
) 0 (
) 30 , 0 (
) 0 | 30 ( = =
= =
=
f
Y X f
f
Logo, 1 0
2
1
2
1
) 0 | ( = + + =

y f
y
, logo f(y|0) uma funo de probabilidade.

O mesmo raciocnio pode ser empregado no clculo das outras probabilidades
condicionais.


Definio: Seja (X,Y) um vetor aleatrio bivariado, com f.d.p. ou f.p. conjunta f(x,y) e
f.d.p. ou f.p. marginais, f(x) e f(y). Ento, X e Y so chamadas de variveis aleatrias
independentes se, para cada x e9 e y e9,
). ( ) ( ) , ( y f x f y x f =

Se X e Y so independentes, a f.d.p. condicional de Y, dado que X = x,
), (
) (
) ( ) (
) (
) , (
) | ( y f
x f
y f x f
x f
y x f
x y f = = =
independe do valor de x. Ou seja, X = x no fornece nenhuma informao a mais sobre
Y.


Exemplo: Considere o seguinte vetor aleatrio (X,Y), com distribuio conjunta dada
por:

X Y-> 1 2 3
10 1/10 2/10 2/10
20 1/10 1/10 3/10

As f.p.s marginais so facilmente calculadas:

28

. 2 / 1 ) 20 ( ) 10 ( = =
X X
f f e . 2 / 1 ) 3 ( 10 / 3 ) 2 ( , 5 / 1 ) 1 ( = = =
Y Y Y
f e f f

As variveis Aleatrias X e Y no so independentes porque a definio de
independncia no verdadeira para todo x e y. Por exemplo,
). 3 ( ) 10 (
4
1
2
1
2
1
10
2
) 3 , 10 ( f f f = = = =

A definio de independncia deve ser mantida para todas as escolhas de x e y se X e Y
tiverem de ser independentes. Note que ). 3 ( ) 10 (
5
1
2
1
10
1
) 1 , 10 (
Y X
f f f = = = Isto ,
se a definio for verdadeira para alguns valores de x e y isto no garante que X e Y
so independentes. Todos os valores devem ser verificados.


Teorema: Se X e Y forem duas variveis aleatrias quaisquer, ento:
)), | ( ( ) ( Y X E E X E = desde que as esperanas existam.


Teorema: Para duas variveis aleatrias quaisquer X e Y,
)), | ( (( )) | ( ( ) ( Y X E V Y X V E X V + = desde que as esperanas
existam.


Covarincia e Correlao
Anteriormente discutimos a ausncia ou presena de uma relao entre duas variveis
aleatrias, independncia ou no independncia. Mas se houve uma relao, esta
poder ser forte ou fraca. Uma das medidas para medir este grau de dependncia a
covarincia, como j definimos anteriormente. Uma outra medida, mais utilizada, e de
melhor interpretao, pode ser obtida atravs do Coeficiente de Correlao.


Definio: A correlao (Coeficiente de Correlao ) de X e Y o nmero definido por

Y X
XY
Y X COV
o o

) , (
=
A correlao sempre entre -1 e 1, com os valores -1 e 1 indicando uma perfeita
relao linear entre X e Y, isto , 1 0 s s
XY
.

a. Quando 0 >
XY
, COV(X,Y) > 0. O diagrama de disperso . 1 ~
XY



b. Quando 0 <
XY
, COV(X,Y) < 0. O diagrama de disperso . 1 ~
XY


29



c. Quando 0 =
XY
, COV(X,Y) = 0 O diagrama de disperso


Exemplo: Dada a distribuio conjunta bidimensional (X,Y) representada pela tabela
abaixo, determinar o coeficiente de correlao entre X e Y.






Precisamos ento encontrar a COV(X,Y), :
Y X
e o o










2 / 1 ) 4 / 4 ( 4 / 6 ) ( ) ( ) (
2 2 2
= = = X E X E X V
2 / 1 ) 4 / 4 ( 4 / 6 ) ( ) ( ) (
2 2 2
= = = Y E Y E Y V
+ + + = =

) 4 / 1 )( 2 )( 0 ( ) 0 )( 1 )( 0 ( ) 0 )( 0 )( 0 ( ) , ( ) ( Y X xyP XY E
y x

+ + + = ) 0 )( 2 )( 1 ( ) 4 / 2 )( 1 )( 1 ( ) 0 )( 0 )( 1 (
2 / 1 ) 0 )( 2 )( 2 ( ) 0 )( 1 )( 2 ( ) 4 / 1 )( 0 )( 2 ( = + + =
2 / 1 ) 1 )( 1 ( 2 / 1 ) ( ) ( ) ( ) , ( = = = Y E X E XY E Y X COV
E finalmente teremos:

( )( )
1
2 / 1 2 / 1
2 / 1 ) , (
=

= =
Y X
XY
Y X COV
o o


Observamos ento que o coeficiente de correlao sendo -1 indica um grau de
dependncia alto entre as variveis X e Y em sentido inverso.


X Y-> 0 1 2
0 0 0 1/4
1 0 2/4 0
2 1/4 0 0
X Y-> 0 1 2 P(X=x) XP(X=x) X
2
P(X=x)
0 0 0 1/4 1/4 0 0
1 0 2/4 0 2/4 2/4 2/4
2 1/4 0 0 1/4 2/4 4/4
P(Y=y) 1/4 2/4 1/4
y P(Y=y) 0 2/4 2/4
Y
2
P(Y=y) 0 2/4 4/4

30

Famlias comuns de distribuies
Distribuies estatsticas so utilizadas para modelar populaes; deste modo,
geralmente lidamos com uma famlia de distribuies em vez de uma nica. Esta
famlia indexada por um ou mais parmetros, o que nos permite variar certas
caractersticas da distribuio, ao mesmo tempo em que permanece com uma forma
funcional. Por exemplo, podemos especificar que a distribuio normal uma opo
razovel para modelar uma populao em particular, mas no podemos especificar
precisamente a mdia. Ento, lidamos com uma famlia paramtrica de distribuies
normais com mdia , onde um parmetro no especificado, -<<.


Distribuies Discretas
Uma varivel aleatria considerada como tendo uma distribuio discreta se o
conjunto de valores de X, o espao amostral, for contvel. Na maioria das situaes, a
varivel aleatria tem como resultados nmeros inteiros.

Distribuio Uniforme Discreta
Uma varivel aleatria X tem distribuio uniforme discreta (1,N) se
N x
N
N x X P ,....., 2 , 1 ,
1
) | ( = = =
onde N um nmero inteiro especificado.

Para calcular a mdia e a varincia de X, lembre-se das identidades (provveis pela
induo)
.
6
) 1 2 )( 1 (
2
) 1 (
1
2
1
+ +
=
+
=

= =
k k k
i e
k k
i
k
i
k
i

Ento, temos

2
1 1
) ( ) (
1 1
+
= = = =

= =
N
N
x x X xP X E
N
x
N
x
e
,
6
) 1 2 )( 1 ( 1
) ( ) (
1
2
1
2 2
+ +
= = = =

= =
N N
N
x x X P x X E
N
x
N
x

e, assim,


12
) 1 )( 1 (
2
1
6
) 1 2 )( 1 (
) ( ) ( ) (
2
2 2
+
= |
.
|

\
| +

+ +
= =
N N N N N
X E X E X V


Distribuio Hipergeomtrica
A distribuio hipergeomtrica tem muitas aplicaes em amostragem de populao
finita e bem mais compreendida por meio do exemplo clssico do modelo de urna.
Suponha que temos uma grande urna preenchida com N bolas que so idnticas em
todos os aspectos, exceto pelo fato de que M so vermelhas e N-M so verdes.
Abrimos a urna com os olhos vendados e selecionamos K aleatoriamente (as K bolas
so coletadas todas de uma vez; um caso de amostragem sem reposio). Qual a
probabilidade de que exatamente x das bolas sejam vermelhas?


31

O nmero total de amostras de tamanho K, que podem ser retiradas das N
bolas .
|
|
.
|

\
|
K
N
exigido que x das bolas sejam vermelhas, e isso pode ser obtido de
|
|
.
|

\
|
x
M
maneiras, deixando
|
|
.
|

\
|

x K
M N
maneiras de completar a amostra K-x bolas
verdes. Assim, se considerarmos que X denota o nmero de bolas vermelhas em uma
amostra de tamanho K, ento K tem uma distribuio hipergeomtrica dada por

. ,...., 2 , 1 , 0 , ) ( K x
K
N
x K
M N
x
M
x X P =
|
|
.
|

\
|
|
|
.
|

\
|

|
|
.
|

\
|
= =
Observe que existe, implicitamente na expresso anterior, outra suposio sobre a
variabilidade de X. Coeficientes binomiais da forma
|
|
.
|

\
|
r
n
so definidos se n r e, assim,
o conjunto de valores de X tambm restringido pelo par de desigualdades
x K M N e x M > >
Que pode ser combinado como
M x K N M s s ) ( .

No muito comum, e simples, verificar que:
. 1 ) (
0 0
=
|
|
.
|

\
|
|
|
.
|

\
|

|
|
.
|

\
|
= =

= =
K
N
x K
M N
x
M
x X P
K
x
K
x

A distribuio hipergeomtrica ilustra o fato de que, estatisticamente, lidar com
populaes finitas (N finito) uma tarefa difcil.

A mdia da distribuio hipergeomtrica dada por
. ) (
1 0
|
|
.
|

\
|
|
|
.
|

\
|

|
|
.
|

\
|
=
|
|
.
|

\
|
|
|
.
|

\
|

|
|
.
|

\
|
=

= =
K
N
x K
M N
x
M
x
K
N
x K
M N
x
M
x X E
K
x
K
x
(soma zero em x = 0)

Para avaliar esta expresso, utilizamos as seguintes identidades:

|
|
.
|

\
|

=
|
|
.
|

\
|
|
|
.
|

\
|

=
|
|
.
|

\
|
1
1
1
1
K
N
K
N
K
N
e
x
M
M
x
M
x
E obtemos

.
1
1
1
1
1
1
1
1
) (
1 1
|
|
.
|

\
|

|
|
.
|

\
|

|
|
.
|

\
|

=
|
|
.
|

\
|

|
|
.
|

\
|

|
|
.
|

\
|

=

= =
K
N
x K
M N
x
M
N
KM
K
N
K
N
x K
M N
x
M
M
X E
K
x
K
x


32

Agora, poderemos reconhecer a segunda soma como a soma das probabilidades para
outra distribuio hipergeomtrica com base nos valores de parmetros N - 1, M - 1 e
K - 1. Isto pode ser visto claramente definindo y = x 1 e escrevendo


1 ) (
1
1
1
) 1 ( ) 1 ( 1
1
1
1
1
1
0
1
0 1
= = =
|
|
.
|

\
|

|
|
.
|

\
|


|
|
.
|

\
|
=
|
|
.
|

\
|

|
|
.
|

\
|

|
|
.
|

\
|

= =
y Y P
K
N
y K
M N
y
M
K
N
x K
M N
x
M
K
y
K
y
K
x


Onde Y uma varivel aleatria hipergeomtrica com parmetros N - 1, M - 1 e K - 1.
Portanto, para a distribuio hipergeomtrica,

N
KM
X E = ) ( .

Para de mostrar a varincia de uma distribuio hipergeomtrica utilizamos do
seguinte artifcio:
=
|
|
.
|

\
|
|
|
.
|

\
|

|
|
.
|

\
|
=

=
K
N
x K
M N
x
M
x x X X E
K
x 0
) 1 ( )] 1 ( [
=
|
|
.
|

\
|

|
|
.
|

\
|

|
|
.
|

\
|

=

=
2
2
2
2
) 1 (
) 1 (
) 1 (
2
K
N
x K
M N
x
M
N N
M M
k k
K
x

=
|
|
.
|

\
|

|
|
.
|

\
|

+
|
|
.
|

\
|

=
2
2
2
2 2 2
) 1 (
) 1 (
) 1 (
2
0
K
N
y K
M N
y
M
N N
M M
k k
K
y


) 1 (
) 1 (
) 1 (

=
N N
M M
k k

E dessa forma teremos:
= + = = ) ( ) ( )] 1 ( [ ) ( ) ( ) (
2 2 2
X E X E X X E X E X E X V
= +

=
2
2 2
) 1 (
) 1 (
) 1 (
N
M K
N
KM
N N
M M
k k
=
(

=
N
KM
N
M
k
N
KM
1
) 1 (
) 1 (
) 1 (

(


=
) 1 (
) )( (
N N
K N M N
N
KM



33

Exemplo: Suponha que uma loja varejista compre mercadorias em lotes e que cada
item possa ser considerado aceitvel ou com defeito. Seja
N = # de itens de um lote,
M = # de produtos com defeito em um lote.
Ento, calculamos a probabilidade de que uma amostra de tamanho K contenha x
mercadorias com defeito. Para sermos especficos, suponha que um lote de 25 peas
de mquinas sejam entregues e que uma pea considerada aceitvel somente se
estiver dentro do limite de tolerncia. Selecionamos 10 peas e descobrimos que nove
no apresentam nenhum defeito (todas as nove esto dentro do limite de tolerncia).
Qual a probabilidade deste evento se houver 6 peas com defeito no lote de 25
peas?
Aplicando a distribuio hipergeomtrica com N = 25, M = 6 e K = 10, temos
, 028 . 0
10
25
10
19
0
6
) 0 ( =
|
|
.
|

\
|
|
|
.
|

\
|
|
|
.
|

\
|
= = X P
Mostrando que nosso evento observado bastante improvvel se houver 6 (ou mais!)
peas com defeito no lote.

Exemplo: Uma firma compra lmpadas por centenas. Examina sempre uma amostra de
15 lmpadas para verificar se esto boas. Se uma centena inclui 12 lmpadas
queimadas, qual a probabilidade de se escolher uma amostra com pelo menos uma
lmpada queimada?
X : nmero de lmpadas queimadas na amostra.
8747 . 0
15
100
15
88
0
12
1 ) 0 ( 1 ) 1 ( 1 ) 1 ( =
|
|
.
|

\
|
|
|
.
|

\
|
|
|
.
|

\
|
= = = < = > X P X P X P


Distribuio Binomial
A distribuio binomial, uma das mais teis distribuies discretas, baseada na idia
de uma Prova de Bernoulli (em homenagem a James Bernoulli, um dos criadores da
teoria da probabilidade), um experimento com dois, e somente dois, resultados
possveis. Uma varivel aleatria X tem distribuio de Bernoulli(p) se

=
p ade probabilid com
p ade probabilid com
X
1 0
1
1 0 ; s s p

O valor X = 1 geralmente identificado como um sucesso e p chamado de
probabilidade de sucesso. O valor X = 0 identificado como fracasso. Nessas
condies a sua funo de probabilidade dada por:
1 0 ; ) 1 ( ) (
1
ou x p p x X P
x x
= = =



A mdia e a varincia de uma varivel aleatria de Bernoulli(p) so facilmente
determinadas como sendo
p p p p p x X P x X E
x
= + = = =

=

1 1 1 0 1 0
1
0
) 1 ( 1 ) 1 ( 0 ) ( ) (

34

p p p X E ou = + = ) 1 ( 0 1 ) (

Para o clculo da varincia fazemos
p p p p p x X P x X E
x
= + = = =

=

1 1 1 2 0 1 0 2
1
0
2 2
) 1 ( 1 ) 1 ( 0 ) ( ) (
logo
) 1 ( ) ( ) ( ) (
2 2 2
p p p p X E X E X V = = =

Muitos experimentos podem ser modelados como uma seqncia de provas de
Bernoulli, sendo a mais simples o lanamento repetido de uma moeda; p =
probabilidade de sair cara, X = 1 se a moeda mostrar cara. Outros exemplos incluem
jogos de apostas (por exemplo, em uma roleta, seja X = 1 se os dados carem no
vermelho, portanto, p = probabilidade de ocorrer vermelho), pesquisas eleitorais (X = 1
se o candidato A receber um voto), e a incidncia de uma doena ( p = probabilidade
de que uma pessoa, aleatoriamente, seja infectada).

Se n idnticas provas de bernoulli forem realizadas, defina os eventos
{ } n i tentativa sima i na X A
i
,..., 2 , 1 , 1 = = =

Se assumirmos que os eventos A
1
,.....,A
n
so uma seqncia de eventos independentes
(como no caso de um lanamento de uma moeda), ento fcil derivar a distribuio
do nmero total de sucesso em n provas. Defina uma varivel aleatria Y por
Y = nmero total de sucessos em n tentativas

O evento {Y = y} ocorrer somente se, de todos os eventos A
1
,.....,A
n
exatamente y
deles ocorrer e necessariamente n y deles no ocorrer. Um resultado em particular
(uma determinada ordenao de ocorrncias e no ocorrncias) das n provas de
Bernoulli pode ser
c
n n
c
A A A A A
1 3 2 1
....... . Isto tem a probabilidade de
ocorrncia

, ) 1 (
) 1 ( )..... 1 ( ) ....... (
1 3 2 1
y n y
c
n n
c
p p
p p p pp A A A A A P

=
= =

Onde utilizamos a independncia dos s A
i
neste clculo. Observe que o clculo no
depende de qual conjunto y s A
i
ocorre, mas somente de que algum conjunto de y
ocorra. Alm disso, o evento {Y = y} ocorrer, no importando qual conjunto de y
s A
i
ocorra. Considerando tudo isto, vemos que uma seqncia em particular de n
provas com exatamente y sucessos tem probabilidade
y n y
p p

) 1 ( de ocorrer. Uma
vez que existem
|
|
.
|

\
|
y
n
dessas seqncia ( o nmero de ordenaes de y 1s e n y 0s,
temos
n y p p
y
n
y Y P
y n y
,..., 2 , 1 , 0 ; ) 1 ( ) ( =
|
|
.
|

\
|
= =


e Y chamada de uma varivel aleatria binomial(n,p).

A varivel aleatria Y pode ser, de forma alternativa e equivalente, definida da
seguinte maneira: em uma seqncia de n provas de Bernoulli idnticas e

35

independentes, cada uma delas com probabilidade de sucesso p, defina as variveis
aleatrias X
1
,...X
n
por

=
p ade probabilid com
p ade probabilid com
X
i
1 0
1

A varivel aleatria

i
n
i
X Y

=
=
1

Tem a distribuio binomial(n,p).


Teorema: Para quaisquer nmeros reais x e y e inteiros n 0,

i n i
n
i
n
y x
i
n
y x

=
|
|
.
|

\
|
= +

0
) (
Em particular, se x = 1 y, ento

i n i
n
i
y x
i
n

=
|
|
.
|

\
|
=

0
1

O valor esperado de uma distribuio binomial(n,p) dado por

y n y
n
y
y n y
n
y
p p
y n y
n
y p p
y
n
y Y E

=

=
|
|
.
|

\
|
=

) 1 (
)! ( !
!
) 1 ( ) (
1 0


y n y
n
y
p p
y n y
n
np

=



=

) 1 (
)! ( )! 1 (
)! 1 (
1
1

1 ; ) 1 (
1
1
1
0
=
|
|
.
|

\
|
=

y j p p
j
n
np
j n j
n
j

np q p np
n
= + =
1
) (

Para encontrar a varincia de uma distribuio binomial (n,p) precisamos achar
y n y
n
y
y n y
n
y
p p
y
n
y y y p p
y
n
y Y E

=

=

|
|
.
|

\
|
+ =
|
|
.
|

\
|
=

) 1 ( ] ) 1 ( [ ) 1 ( ) (
1
2
0
2




np
y n y
n
y
y n y
n
y
p p
y
n
y p p
y
n
y y

=

=

|
|
.
|

\
|
+
|
|
.
|

\
|
=

) 1 ( ) 1 ( ) 1 (
1 2

np p p
y n y
n
y y
y n y
n
y
+

=

=

) 1 (
)! ( !
!
) 1 (
2

np p p
y n y
n
y n y
n
y
+

=

=

) 1 (
)! ( )! 2 (
!
2

np p p
y n y
n
n n
y n y
n
y
+


=

=

) 1 (
)! ( )! 2 (
)! 2 (
) 1 (
2

np p p
x n x
n
n n y x fazendo
x n x
n
y
+

= =

=

2 2
2
) 1 (
)! 2 ( !
)! 2 (
) 1 ( ; 1

36

np p p
x
n
p n n
x n x
n
x
+
|
|
.
|

\
|
=


1
2
2
0
2
) 1 (
2
) 1 (
np p n n + =
2
) 1 (

logo
2 2 2 2 2
) 1 ( ) ( ) ( ) ( p n np p n n X E X E X V + = =
) 1 (
2 2 2 2 2 2
p np np np p n np np p n = = + =

Exemplo: Uma prova tipo teste tem 50 questes independentes. Cada questo tem 5
alternativas. Apenas uma das alternativas a correta. Se um aluno resolve a prova
respondendo a esmo as questes, qual a probabilidade de tirar nota 5?

Seja X = { nmeros de acertos nas 50 questes]; x = 0,1,2,....,50
p = probabilidade de acerto em cada questo = 1/5

logo X ~ Bin(50,1/5) e dessa forma queremos

000002 , 0
5
4
5
1
25
50
) 25 (
25 25
= |
.
|

\
|
|
.
|

\
|
|
|
.
|

\
|
= = X P

Exemplo: Suponha que um determinado trao (como a cor do olho ou a habilidade
com a mo esquerda) de uma pessoa seja classificada com base em par de genes, e
suponha tambm que d represente um gene dominante e r um gene recessivo. Assim,
uma pessoa com dd genes puramente dominante, uma com rr puramente
recessiva e uma com rd hbrida. Os indivduos puramente dominantes e os indivduos
hbridos tem a mesma aparncia. Filhos recebem 1 gene de cada pai. Se, com respeito
a um trao em particular, e pais hbridos tem um total de 4 filhos, qual a
probabilidade de que 3 dos 4 filhos tenham a aparncia do gene dominante?

Se considerarmos a hiptese de que cada filho tem a mesma probabilidade de
herdar um dos 2 genes de cada pai, as probabilidades de que 2 pais hbridos tenham
dd, rr e rd pares de genes so, respectivamente, de 1/4, 1/4 e 1/2. Com isso, como um
filho ter a aparncia externa do gene dominante se seu par de genes for dd ou rd,
tem-se que o nmero de filhos com essas caractersticas distribudo binomialmente
com parmetros (4, 3/4). Assim, a probabilidade desejada
0,42
64
27
4
1
4
3
3
4
) 3 (
1 3
= = |
.
|

\
|
|
.
|

\
|
|
|
.
|

\
|
= = X P

Exemplo: 20% dos refrigeradores produzidos por uma empresa so defeituosos. Os
aparelhos so vendidos em lotes de 50 unidades. Um comprador adotou o seguinte
procedimento: de cada lote ele testa 20 aparelhos e se houver pelo menos 2
defeituosos o lote rejeitado.
Admitindo-se que o comprador tenha aceitado o lote, qual a probabilidade de ter
observado exatamente um aparelho defeituoso?

X = { nmero de defeituosos no lote de 20 aparelhos } ; x = 0,1,2,...,20
p = probabilidade de aparelho defeituoso = 0,20
X ~ Bin(20; 0,20)

37

Queremos ) | 1 ( lote o Aceitou X P = , ento

= = + = = < = ) 1 ( ) 0 ( ) 2 ( ) ( X P X P X P lote o Aceitar P
( ) ( ) ( ) ( ) 069175 , 0 8 , 0 2 , 0
1
20
8 , 0 2 , 0
0
20
19 1 20 0
=
|
|
.
|

\
|
+
|
|
.
|

\
|
=

0,833333
069175 , 0
0,057646
) (
) 1 (
) | 1 ( = =
=
= =
lote o Aceitar P
X P
lote o Aceitar X P

Exemplo: Seja X ~ Bin(20; 0,3). Encontre a mdia e a varincia da varivel aleatria
Y = 3 X + 2.
6 ) 3 , 0 )( 20 ( ) ( = = = np X E
2 , 4 ) 7 , 0 )( 3 , 0 )( 20 ( ) 1 ( ) ( = = = p np X V

logo, 20 2 ) 6 )( 3 ( 2 ) ( 3 ) 2 3 ( ) ( = + = + = + = X E X E Y E
e 8 , 37 ) 2 , 4 )( 9 ( ) ( 9 ) 2 3 ( ) ( = = = + = X V X V Y V


Distribuio de Poisson
A distribuio de Poisson foi introduzida por Simon Denis Poisson em um livro que
escreveu a respeito da aplicao da teoria da probabilidade a processos, julgamento
criminais e similares. O titulo do livro, publicado em 1837, era Recherches sur la
probabilit de jugements en matire criminelle et en matire civile (Investigaes sobre
a probabilidade de veredictos em matrias criminal e civil).
Esta uma distribuio discreta podendo ser amplamente aplicada para uma srie de
diferentes tipos de experimentos. Por exemplo, se estivermos modelando um
fenmeno no qual esperamos por uma ocorrncia (assim como esperamos um nibus,
ou clientes que chegam em um banco, etc), o nmero de ocorrncias em um
determinado intervalo de tempo pode, algumas vezes, ser modelado pela distribuio
de Poisson. Uma das suposies bsicas sobre a qual esta distribuio desenvolvida
a de que, para pequenos intervalos de tempo, a probabilidade de uma chegada
proporcional ao tempo de espera.
Outra rea de aplicao a das distribuies espaciais, onde, por exemplo, a
distribuio de Poisson pode ser utilizada para modelar a distribuio de uma bomba
que atinge uma rea ou a distribuio de peixes em um lago.
A distribuio de Poisson tem um nico parmetro , as vezes chamado de parmetro
de intensidade. Uma varivel aleatria X, assumindo valores nos nmeros inteiros no
negativos, tem uma Distribuio de Poisson() se
... ,......... 2 , 1 , 0 ;
!
) ( = = =

x
x
e
x X P
x



Para verificar que , 1 ) (
0
= =

=
x X P
x
lembre-se da expanso em srie, de Taylor, de
e
y
,
.
!
0
i
y
e
i
i
y

=
=
Assim,

38

. 1
!
) (
0
0
= = = =

=



e e
x
e x X P
x
x
x


A mdia de X facilmente verificada como sendo

! !
) (
1 0
x
e
x
x
e
x X E
x
x
x
x

=

= =

! )! 1 (
0
1
1
y
e
x
e
y
y
x
x

= (substituir y = x 1)


= =

e e

Um clculo similar mostrar que

!
)] 1 ( [
!
) (
1
2
0
2
x
x x e
x
e
x X E
x
x
x
x

= =


=

=


! !
) 1 (
0 1
x
x e
x
x x e
x
x
x
x




=

+ =

= +


)! 2 ( )! 2 (
2
2
2
2
x
e
x
e
x
x
x
x

fazendo y = x 2


+ = + = + =

2 2
0
2
!
e e
y
e
y
y

sendo assim, teremos
= + = =
2 2 2 2
) ( ) ( ) ( X E X E X V

Exemplo: Considere um operador de telemarketing que, em mdia, atende cinco
chamadas a cada trs minutos. Qual a probabilidade de que no ocorrero chamadas
no minuto seguinte? E, pelo menos, duas chamadas?

Se considerarmos que X = {nmero de chamadas em um minuto}, ento X tem
uma distribuio de Poisson com E(X) = = 5/3. Desse modo
; 189 , 0
! 0
) 3 / 5 (
) 0 (
3 / 5
0 3 / 5
= = = =

e
e
X P
e, no caso de pelo menos duas chamadas no minuto seguinte
= = + = = < = > )] 1 ( ) 0 ( [ 1 ) 2 ( 1 ) 2 ( X P X P X P X P
. 496 , 0 ]
! 1
) 3 / 5 (
! 0
) 3 / 5 (
[ 1
1 3 / 5 0 3 / 5
= + =

e e



Aproximao da Distribuio Binomial pela Distribuio de Poisson
A aproximao vlida quando n grande (n > 30) e p pequeno (p < 0,10), que
exatamente quando mais til, pois nos libera de calcular coeficientes binomiais e
potncias para grandes n.

Seja X ~ Bin(n, p), ento

x n x
p p
x
n
x X P

|
|
.
|

\
|
= = ) 1 ( ) (

39


x n
x
x n x
p
x
p
x n n n p p
x n x
n

+ =

= ) 1 (
!
) 1 )....( 1 ( ) 1 (
)! ( !
!


Fazendo = n p ento p = / n e quando n
=

|
.
|

\
|
|
.
|

\
|
+ = =


x n x
parcelas k temos
n
n x n
x n n n n x X P

1
!
1
) 1 )....( 2 )( 1 ( ) (
lim


=

|
.
|

\
|
|
.
|

\
|
|
.
|

\
|
|
.
|

\
|
|
.
|

\
|
=


1
1 1
!
1 1
1 ......
2
1
1
1 1
lim
x
e
n
x
n
n n x n
x
n n



!
1
!
1
. 1 ..... 1 . 1 . 1
x
e
e
x
x
x

= =
Logo,

!
) (
x
e
x X P
x


~ = que chamada Distribuio de Poiss().

Exemplo: Um tipgrafo, em mdia, comete um erro a cada 500 palavras impressas.
Uma pgina tpica contm 300 palavras. Qual a probabilidade de que no ocorram
mais que dois erros em cinco pginas?

Se assumirmos que a impresso de uma palavra uma prova de Bernoulli com
probabilidade de sucesso p = 1/500 (observe que estamos identificando um erro como
sendo um sucesso) e que as provas so independentes, ento X = {nmero de erros
em cinco pginas (1500 palavras) binomial(1500; 1/500). Portanto,
4230 , 0
500
499
500
1
1500
) 2 ( ) (
1500
2
0
= |
.
|

\
|
|
.
|

\
|
|
|
.
|

\
|
= s =

=

x x
x
x
X P erros dois que mais no P

que um clculo bastante complicado. Se utilizarmos a aproximao de Poisson com
= 1500 (1/500) = 3, temos
4232 , 0
2
9
3
!
3
) 2 (
3
3 3
3 2
0
= + + = = s

e
e e
x
e
X P
x
x



Processo de Poisson
Considere uma seqncia de eventos que ocorrem ao longo do tempo, como o
nmero de carros vermelhos que param num sinal, o nmero de chamadas telefnicas
que chegam numa estao durante um certo intervalo de tempo, a ocorrncia de um
terremoto, o inicio de uma guerra, etc.
Seja X
t
o nmero de ocorrncias no intervalo de tempo [0,t]. Claramente X
t
uma
varivel aleatria discreta com valores possveis 0, 1, 2, ...........

Para derivar a densidade de X
t
partimos das seguintes premissas:
Seja At um intervalo de tempo pequeno. Ento:
1) A probabilidade de exatamente uma ocorrncia em um intervalo de tempo At
aproximadamente k. At.

40

2) A probabilidade de exatamente zero ocorrncias em um intervalo de tempo At
aproximadamente 1-k. At.
3) A probabilidade de duas ou mais ocorrncias em um intervalo de tempo At igual
a um certo o(At), onde o(At)/ At tende a zero a medida que At tende a zero. Em
outras palavras, a probabilidade de duas ou mais ocorrncias em um intervalo de
tempo At um valor muito pequeno, e este valor decresce a zero mais
rapidamente que o comprimento do intervalo At.

Estas trs premissas definem o tipo de processo que pode ser chamado de um
processo de Poisson.
O parmetro k acima um nmero real > 0, chamado de taxa mdia de ocorrncia.
Para cada instante t > 0 seja:
,...... 2 , 1 , 0 ) ( ) ( = = = x onde t p x X P
t


Fixando um instante qualquer t e aplicando a segunda premissa nos d:
) ( ] 1 [ ) (
0 0
t p t k t t p A ~ A +

Subtraindo p
0
(t) de ambos os lados e dividindo o resultado por At leva a:
) (
) ( ) (
0
0 0
t kp
t
t p t t p
~
A
A +


Tomando-se o limite desta ltima expresso quando At tende a zero encontramos, do
lado esquerdo, a derivada de p
0
(t). Isto nos d a equao diferencial:
) ( ) (
0
'
0
t kp t p =

Para x > 0 pode-se provar que as premissas resultam no seguinte sistema de equaes
diferenciais:
,......... 3 , 2 , 1 ) ( ) ( ) (
1
'
= + =

x onde t kp t kp t p
x x x


A soluo deste sistema :
... ,......... 2 , 1 , 0 ;
!
) (
) ( = =

x
x
kt e
t p
x kt
x


Para qualquer intervalo [0,t], se fixarmos t e fizermos = k.t a equao acima reduz-se
a:
... ,......... 2 , 1 , 0 ;
!
) ( ) ( = = = =

x
x
e
x f x X P
x



Ou seja, X tem distribuio de Poisson com parmetro .

Uma distribuio de Poisson modela bem eventos raros, isto , que no acontecem
com grande freqncia para qualquer intervalo de tempo fixo. Por exemplo, o nmero
de automveis Corsa que entram num estacionamento no Rio de Janeiro num
intervalo de tempo de 1 hora certamente no uma varivel de Poisson, mas o
nmero de Ferraris que entram no estacionamento no mesmo perodo de tempo deve
ser Poisson.


41

Exemplo: Queremos um modelo para o nmero de gols por partida no campeonato
brasileiro X. Suponha que sabemos que h 3 gols por jogo na mdia (isto , 2 gols por
hora). Podemos tentar:
- Modelo 1: Divida o jogo em 3 blocos de 30 minutos cada. Em cada bloco h um
gol. Neste caso, X = 3, com 100% de chance (tecnicamente X ~ Bin(3; 1)). A
mdia esta correta, mas o modelo no nos parece muito bom.
- Modelo 2: Divida o jogo em 6 blocos de 15 minutos cada. Em cada bloco h um
gol com probabilidade 50%. Neste caso X ~ Bin(6; 0,5). A mdia ser de 3 gols
por jogo, e cada jogo poder ter de 0 a 6 gols. O modelo nos parece melhor,
mas jamais gerar um daqueles raros 7 x 2 (como o Atltico PR vs Vasco de
2005).
- Modelo 3: Divida o jogo em 90 blocos de 1 minuto cada. Em cada bloco
haver um gol com probabilidade 1/30. Assim, X ~ Bin(90; 1/30) tem o valor
esperado correto, e at os raros jogos com mais de 8 gols (at 90 gols!) podem
aparecer.
- Modelo N: Divida o jogo em N blocos, pode haver um gol por bloco com
probabilidade 3/N. Ento X ~ Bin(N; 3/N).

O que acontece se tomarmos ento N ? As distribuies binomiais de
probabilidade se aproximam de uma nova distribuio, chamada distribuio de
Poisson. Neste caso, dizemos que X ~ Poiss(3).


Distribuio Binomial Negativa ou Distribuio de Pascal
A distribuio binomial conta o nmero fixo de sucessos em um nmero fixo de provas
de Bernoulli. Suponha que, em vez disso, contamos o nmero de provas de Bernoulli
necessrios para obter um nmero fixo de sucessos. Esta ltima formulao leva a
distribuio binomial negativa.

Em uma seqncia de provas de Bernoulli independentes (p), seja a varivel aleatria X
denotando a prova no qual o r-simo sucesso ocorre, onde r um nmero inteiro fixo.
Ento
... ,......... 2 , 1 , , ) 1 (
1
1
) ( + + =
|
|
.
|

\
|

= =

r r r x p p
r
x
x X P
r x r


e dizemos que X tem uma distribuio binomial(r,p)negativa.

Temos,

r x r r
r x
k
p p
r
x
x X E

=

|
|
.
|

\
|

) 1 (
1
1
] [
|
|
.
|

\
|
=
|
|
.
|

\
|

|
|
.
|

\
|
=
+

r
x
r
r
x
x que j p p
r
x
x
p
r
r x r r
r x
1
1
) 1 (
1 1

1 ) 1 (
1
) 1 (
) 1 ( 1 1
1
+ =
|
|
.
|

\
|
=
+ +

+ =

x m se fazendo p p
r
m
m
p
r
r m r r
r m

] ) 1 [(
1
=
k
Y E
p
r

onde Y uma varivel alegoria binomial negativa com parmetros r+1, p.


42

Fazendo k = 1 na equao anterior, obtemos:

p
r
X E = ] [ que a mdia de uma distribuio binomial negativa(r,p)
Fazendo k = 2 na equao anterior e usando a formula para o valor esperado de uma
varivel aleatria binomial negativa, obtemos:

|
|
.
|

\
|

+
= = 1
1
] 1 [ ] [
2
p
r
p
r
Y E
p
r
X E
Portanto,

2 2
2
2 2
) 1 (
1
1
) ( ) ( ) (
p
p r
p
r
p
r
p
r
X E X E X V

=
|
|
.
|

\
|

+
= =

Exemplo: A probabilidade de que um sinal de trnsito esteja aberto numa esquina
0,20. Qual a probabilidade de que seja necessrio passar pelo local 10 vezes para
encontr-lo aberto pela 4 vez?
X ={nmero de passagens pela esquina para encontrar o sinal aberto pela 4 vez}
r = 4; p = 0,20
X ~ Binomial Negativa(4; 0,20)
035232 , 0 ) 80 , 0 ( ) 20 , 0 (
3
9
) 10 (
6 4
=
|
|
.
|

\
|
= = X P

Exemplo: Uma tcnica conhecida como amostragem binomial negativa til na
amostragem de populaes biolgicas. Se a proporo de indivduos que apresentam
uma determinada caracterstica p e fazemos a amostragem at obcecarmos r desses
indivduos, ento, o nmero de indivduos amostrados uma varivel aleatria
binomial negativa.
Por exemplo, suponhamos que em uma populao de moscas-da-fruta estamos
interessados na proporo que tem asas vestigiais, e decidimos fazer a amostragem
at encontrarmos 100 dessas moscas. A probabilidade de que teremos de examinar
pelo menos N moscas

100 100
) 1 (
99
1
) (

=

|
|
.
|

\
|
= >

x
N x
p p
x
N X P
100 100
1
100
) 1 (
99
1
1

=

|
|
.
|

\
|
=

x
N
x
p p
x


Para determinarmos p e N, podemos avaliar esta expresso a fim de determinar para
quantas moscas-da-fruta provavelmente estaremos olhando.

Exemplo: O presidente de uma empresa toma decises sobre a empresa com base
num jogo de golfe na sua sala. A probabilidade do presidente acertar uma tacada 0,6
e suponha que todas as suas tacadas so independentes e com a mesma
probabilidade.
A regra de deciso simples: o presidente continua a jogar at acertar 3 tacadas. Se as
3 tacadas certas so obtidas em 5 ou menos jogadas, o presidente aceita a proposta
que lhe foi submetida. Do contrrio ( se ele demora mais do que 5 jogadas para acertar
3 tacadas), o presidente fica de mau humor e rejeita a proposta. A secretria entra na
sala e entrega uma proposta para a construo de uma nova fbrica. Qual a
probabilidade da proposta ser aceita?

43


O evento de interesse : 3 tacadas certas em 5 ou menos jogadas. Ou seja, o
terceiro sucesso encontrado na 3 , 4 ou na 5 jogada. Logo, devemos calcular como
probabilidade de aceitao da proposta P(X 5)=P(X = 3)+P(X = 4)+P(X = 5) onde X
indica a tentativa onde o terceiro sucesso ocorre.
Note que X ~ Nbin(r=3; p=0,60) e assim:

3 3
5
3
) 1 (
1
1
) 5 (

=

|
|
.
|

\
|

= s

x
x
p p
r
x
X P

=
|
|
.
|

\
|
+
|
|
.
|

\
|
+
|
|
.
|

\
|
=
2 3 1 3 0 3
) 40 , 0 ( ) 60 , 0 (
2
4
) 40 , 0 ( ) 60 , 0 (
2
3
) 40 , 0 ( ) 60 , 0 (
2
2

6826 , 0 2074 , 0 2592 , 0 2160 , 0 = + + =

Exemplo: Lana-se um dado justo at a obteno do terceiro seis. Seja X o nmero
de lanamentos efetuados. Qual a distribuio de X? Qual a probabilidade de
fazermos exatamente 6 lanamentos? Menos de 6? Mais de 6? Calcule E(X) e V(X).
A distribuio de X binomial negativa, X ~ Nbin(3; 1/6). Ento
026792 , 0 ) 6 / 5 ( ) 6 / 1 (
2
5
) 6 (
3 3
=
|
|
.
|

\
|
= = X P
= = + = + = = < ) 3 ( ) 4 ( ) 5 ( ) 6 ( X P X P X P X P
035494 , 0 ) 6 / 5 ( ) 6 / 1 (
2
2
) 6 / 5 ( ) 6 / 1 (
2
3
) 6 / 5 ( ) 6 / 1 (
2
4
0 3 1 3 2 3
=
|
|
.
|

\
|
+
|
|
.
|

\
|
+
|
|
.
|

\
|
=

9377 , 0 035494 , 0 1 ) 6 ( 1 ) 6 ( = = < = > X P X P

90
) 6 / 1 (
) 6 / 5 ( 3 ) 1 (
) ( 18
6 / 1
3
) (
2 2
= =

= = = =
p
p r
X V e
p
r
X E
Na mdia deveramos jogar o dado 18 vezes para obtermos o terceiro seis.


Distribuio Geomtrica
A distribuio geomtrica a mais simples das distribuies de tempo de espera e
um caso especial da distribuio binomial negativa. Se definirmos r = 1 na funo de
probabilidade da distribuio binomial negativa teremos
......... , 2 , 1 , ) 1 ( ) (
1
= = =

x p p x X P
x


O que define a funo de probabilidade de uma varivel aleatria geomtrica X com
probabilidade de sucesso p. X pode ser interpretado com a prova no qual ocorre o
primeiro sucesso, de modo que estamos esperando por um sucesso.

= = = =

=

1
1
1
1 1
) 1 ( ) 1 ( ) (
x
x
x
x x
p p p p x X P
= + + + + =
= =
] ....... ) 1 ( ) 1 ( ) 1 ( 1 [
1 1 lim
3 2
1

p razo e a onde itada i PG
p p p p
1
) 1 ( 1
1
= =

=
p
p
p
p

44


Exemplo: A probabilidade de que um sinal de trnsito esteja aberto numa esquina
0,20. Qual a probabilidade de que seja necessrio passar pelo local 5 vezes para
encontr-lo aberto pela 1 vez?
X ={nmero de passagens pela esquina para encontrar o sinal aberto pela 1 vez}
p = 0,20
X ~ Geom( 0,20)
08192 , 0 ) 80 , 0 )( 20 , 0 ( ) 5 (
4
= = = X P

O valor esperado pode ser encontrado como


x
x
x
x
x
x
p
p d
d
p p x p p xp X E ) 1 (
) 1 (
) 1 ( ) 1 ( ) (
1
1
1
1
1

= = =


=

=

p p
p
p
p
p d
d
p p
p d
d
p
x
x
1 1 1
) 1 (
) 1 (
) 1 (
2
1
= =

=


E para o clculo da varincia temos:

1
1
1 2
1
1 2
1
2
) 1 ]( ) 1 ( [ ) 1 ( ) 1 ( ) (

=
+ = = =

x
x
x
x
x
x
p x x x p p x p p p x X E
1
1
1
1
) 1 ( ) 1 )]( 1 ( [

=
+ =

x
x
x
x
p x p p x x p
p
p
p d
d
p p
p
p x x p p
x
x
x
x
1
) 1 (
) 1 (
) 1 (
1
) 1 )]( 1 ( [ ) 1 (
2
2
1
2
1
+

= + =


=

=

p p
p
p d
d
p p
p
p
p d
d
p p
x
x
1 1
) 1 (
) 1 (
1
) 1 (
) 1 (
) 1 (
2
2
1
2
2
+
)
`

= +

=

2 3 3
) 1 ( 2 1 ) 1 ( 2 1
) 1 (
2
) 1 (
p
p p
p p
p p
p p
p p
+
= +

= +

=

logo, a varincia de X ser


p
p
p p
p p
X E X E X V

=
|
|
.
|

\
|

+
= =
1 1 ) 1 ( 2
) ( ) ( ) (
2
2
2 2


Exemplo: Se a probabilidade de que um certo ensaio d reao positiva for igual a
0.4, qual ser a probabilidade de que 5 reaes negativas ocorram antes da primeira
positiva?
Chamando de Y o nmero de reaes negativas antes da primeira positiva,
teremos
,..... 3 , 2 , 1 , 0 ), 4 . 0 ( ) 6 . 0 ( ) ( = = = k k Y P
k

Da
92 . 0 ) 4 . 0 ( ) 6 . 0 ( ) 5 (
4
0
= = <

=
k
k
Y P


45

Exemplo: O custo de realizao de uma experincia de R$ 1000. Se a experincia
falhar existe um custo adicional de R$ 300. A probabilidade de sucesso em cada
realizao da experincia 0.2, e as tentativas so independentes. Supe-se que a
experincia repetida indefinidamente at encontrarmos o primeiro sucesso. Qual o
custo esperado do procedimento completo? Suponha que o custo mximo que a
empresa est disposta a pagar at que a experincia seja completada de R$ 8000.
Qual a probabilidade de que a experincia custe mais do que isso?

Seja C a varivel aleatria que representa o custo da experincia, e defina X
como sendo o nmero de repeties necessrias at encontrar o primeiro sucesso.
Ento:
300 1300 ) 1 ( 300 1000 = + = X X X C

Pela linearidade do valor esperado:
300 ) ( 1300 ) ( = X E C E

Mas, X ~ Geom(p=0.2) e assim E(X) = 1/0.2 = 5. Logo o custo esperado da experincia :
. 6200 300 ) 5 ( 1300 ) ( = = C E

E, finalmente
= + > = > = > ) 300 8000 1300 ( ) 8000 300 1300 ( ) 8000 ( X P X P C P
= > ~ > = > = ) 6 ( ) 92 . 5 ( ) 1300 / 8300 ( X P X P X P
{ }= = + + = + = = < = ) 5 ( ... ) 2 ( ) 1 ( 1 ) 6 ( 1 X P X P X P X P
{ } 472 . 0 ) 8 . 0 ( ) 8 . 0 ( ) 8 . 0 ( ) 8 . 0 ( 1 2 . 0 1
4 3 2
= + + + + =

A distribuio geomtrica tem uma propriedade interessante, conhecida como a
propriedade sem memria. Para nmeros inteiros s > t quaisquer, tem-se
) ( ) | ( t s X P t X s X P > = > >
isto , a distribuio geomtrica se esquece do que ocorreu. A probabilidade de
ocorrer outros fracassos s-t, depois de j terem sido observados t fracassos, a mesma
que probabilidade de observar s-t fracassos no incio da seqncia. Em outras
palavras, a probabilidade de se obter uma seqncia de fracassos depende somente
do tamanho da seqncia, no de sua posio.

A prova do teorema se da atravs da definio de probabilidade condicional e da soma
dos termos de uma Progresso Geomtrica ilimitada de razo q
|
|
.
|

\
|

=
q
a
S
n
1
1
.
Primeiramente notamos que para qualquer nmero inteiro n,

n
p tentativas n em sucessos sem P n X P ) 1 ( ) ( ) ( = = >

e, assim,
=
>
>
=
>
> >
= > >
) (
) (
) (
) (
) | (
t X P
s X P
t X P
t X s X P
t X s X P

46

=
+ + +
+ + +
=
+
+
+ + +
+ + +
) 1 ( 1
) 1 (
) 1 ( 1
) 1 (
....... ) 1 ( ) 1 ( ) 1 (
....... ) 1 ( ) 1 ( ) 1 (
1
1
3 2 1
3 2 1
p
p
p
p
p p p
p p p
t
s
PG
t t t
s s s

t s
t
s
t
s
p
p
p
p p
p p

=

=


= ) 1 (
) 1 (
) 1 (
) 1 )( 1 (
) 1 )( 1 (

). ( t s X P > =

Exemplo: Algumas vezes, a distribuio geomtrica utilizada para modelar tempo de
vida ou tempo at a ocorrncia da falha de componentes. Por exemplo, se a
probabilidade de 0.001 de que uma lmpada ir queimar em determinado dia, ento
a probabilidade de que ela ir durar pelo menos 30 dias
970 . 0 ) 999 . 0 ( ) 001 . 0 1 ( 001 . 0 ) 30 (
30 1
31
= = = >

x
x
X P

A propriedade sem memria da distribuio geomtrica descreve uma propriedade de
ausncia de envelhecimento muito especial, que indica que a distribuio
geomtrica no aplicvel a modelagem de tempo de vida para o qual se espera que a
probabilidade de falha aumente com o decorrer do tempo. Existem outras
distribuies utilizadas para modelar vrios tipos de envelhecimento; veja, por
exemplo, Barlow, R. e Proscan, E. Statistical Theory of Life Testing. Nova York: Holt,
Rinehart and Winston, 1975.


Distribuies Contnuas
Como j salientamos anteriormente, em muitos problemas se torna matematicamente
mais simples considerar um espao amostral idealizado para uma varivel aleatria
X, no qual todos os nmeros reais possveis (em algum intervalo especificado ou
conjunto de intervalos) possam ser considerados como resultados possveis. Dois
exemplos so a hora de chegada de um trem em uma determinada estao e o tempo
de vida de um chip. Desta maneira, seremos levados as variveis aleatrias contnuas.
Dizemos que X uma varivel aleatria contnua se existir uma funo no negativa f,
definida para todo real xe(-, ), que tenha a propriedade de que, para qualquer
conjunto B de nmeros reais,

}
= e
B
dx x f B X P ) ( ) (

A funo f chamada de funo de densidade de probabilidade (f.d.p.) da varivel
aleatria X.
Colocando em palavras, a equao anterior diz que a probabilidade de que X esteja em
B pode ser obtida integrando-se a funo densidade de probabilidade ao longo do
conjunto B. Como X deve assumir algum valor, f deve satisfazer
{ } dx x f X P ) ( ) , ( 1
}


= e =

Tudo o que se deseja saber sobre X pode ser respondido em termos de f. Por exemplo,
fazendo B=[a, b], obtemos
dx x f b X a P B X P
b
a
) ( ) ( ) (
}
= s s = e

47


Se fizermos a=b, obtemos
0 ) ( ) ( = = =
}
dx x f a X P
a
a

Colocando em palavras, essa equao diz que a probabilidade de que uma varivel
aleatria contnua assuma qualquer valor especfico zero. Portanto, para uma
varivel aleatria contnua,
dx x f a F a X P a X P
a
) ( ) ( ) ( ) (
}

= = s = <




Distribuio Normal
A distribuio normal foi introduzida pelo matemtico francs Abraham DeMoivre em
1733, que a utilizou para obter aproximaes probabilsticas associadas as variveis
aleatrias binomiais com parmetro n grande. Esse resultado foi mais tarde estendido
por Laplace e outros e hoje esta incorporado em um teorema probabilstico conhecido
como o teorema do limite central.
A distribuio normal (algumas vezes chamada de distribuio Gaussiana) representa
um papel central em um grande conjunto de estatsticas. Existem trs principais razes
para isto. Primeiro, a distribuio normal e associadas a ela so muito tratveis
analiticamente (embora isto talvez no seja percebido a primeira vista). Segundo, a
distribuio normal tem o familiar formato de um sino, cuja simetria a transforma em
uma escolha atrativa para muitos modelos de populaes. Embora existam muitas
outras distribuies que tambm tem formato de sino, a maior parte delas no tem a
tratabilidade analtica da distribuio normal. Terceiro, existe o Teorema do Limite
Central (TLC), o que mostra que, em condies moderadas, a distribuio normal
pode ser utilizada para aproximar uma grande variedade de distribuies em grandes
amostras.
A distribuio normal tem dois parmetros, geralmente denotados por e o
2
, que so
sua mdia e sua varincia. A f.d.p. da distribuio normal com mdia e varincia o
2

(geralmente denotada por N(, o
2
)) dada por
. ,
2
1
) ( ) , | (
2
2
2
) (
2
< < = =

x e x f x f
x
o

o t
o

Para provar que f(x) de fato uma densidade de probabilidade, precisamos mostrar
que
1
2
1 2
2
2
) (
=


}
dx e
x
o

o t


Fazendo a substituio
o
) (
=
x
y , acarretando dy dx o = , e resultando
dy e dx e
y
x
2 2
) (
2
2
2
2
1
2
1


} }
=
t o t
o



Com isso, precisamos mostrar que

48

t 2
2
2
=


}
dy e
y


Com esse objetivo, considere .
2
2
dy e I
y


}
= Ento,
ds e dy e I
s y
2 2
2
2 2
.




} }
=
dyds e I
s y
2
) (
2
2 2
+


} }
=

Avaliamos agora a integral dupla por meio de uma mudana de variveis para
coordenadas polares (isto , s = r cos u, y = r sen u, e dy ds = r du dr). Assim,
dr d r e dr rd e I
r r
u u
t t
} } } }

= =
2
0
2
0
2
2
0 0
2
2 2

t t t 2 2 2
0
2 2
0
2
2 2
=
(
(

= =


}
r r
e dr re I
Com isso, t 2 = I e o resultado esta demonstrado.

Considere X normalmente distribuda com parmetros .
2
o e Ento
), 1 , 0 ( ~
) (
N
X
Z
o

= isto , Z normalmente distribuda com parmetros 0 = e
. 1
2
= o Tal varivel aleatria chamada de varivel aleatria normal padro ou
unitria.
0
) ( )] [( ) (
) ( =

=
(


=
o

o

o

o
X E X E X
E Z E
1
) ( )] [( ) (
) (
2
2
2 2
= = =

=
(


=
o
o
o o

o
X V X V X
V Z V

Essa varivel aleatria extremamente til pois os valores desta distribuio esto
tabelados, dispensando o clculo da integral.

Pode-se demonstrar tambm que se X ~ N(, o
2
) ento Y = aX + b ter tambm
distribuio normal tal que Y ~ N(a+b, a
2
o
2
).

A distribuio normal , de certo modo, especial, no sentido de que seus dois
parmetros, (a mdia) e o
2
(a varincia), nos fornecem informaes completas sobre
o formato e a localizao exatos da distribuio.

O clculo direto mostra que a f.d.p. normal tem seu mximo em x = e a pontos de
inflexo (onde a curva se modifica de cncava para convexa) em o . Alm disso, o
contedo de probabilidade dentro de 1, 2 ou 3 desvios padro da mdia
6826 . 0 ) 1 | (| ) |) (| = s = s Z P X P o
9544 . 0 ) 2 | (| ) 2 |) (| = s = s Z P X P o
9974 . 0 ) 3 | (| ) 3 |) (| = s = s Z P X P o

49





onde X ~ N(, o
2
) e Z ~ N(0,1).

Exemplo: Uma fbrica de carros sabe que os motores de sua fabricao tem durao
com distribuio aproximadamente normal com mdia de 150.000 km e desvio padro
de 5.000 km. Qual a probabilidade de que um carro, escolhido ao acaso, dos
fabricados por essa firma, tenha um motor que dure:
a) Menos de 170.000 km?
b) Entre 140.000 km e 165.000 km?
c) Se a fbrica substitui o motor que apresenta durao inferior a garantia,
qual deve ser esta garantia para que a porcentagem de motores
substitudos seja inferior a 0.2%?

Seja X = {durao do motor em km} onde X ~ N(150.000; (5.000)
2
)
Temos ento ) 1 , 0 ( ~
000 . 5
000 . 150 ) (
N
X X
Z

=

=
o


a) 1 ) 4 ( )
000 . 5
000 . 150 000 . 170
( ) 000 . 170 ( ~ < =

< = < Z P Z P X P
b) = < < ) 000 . 165 000 . 140 ( X P
=

< <

= )
000 . 5
000 . 150 000 . 165
000 . 5
000 . 150 000 . 140
( Z P
97590 . 0 ) 3 2 ( = < < = Z P
c) 002 . 0 ) ( = <
o
X X P
Para que a probabilidade seja 0.002 precisamos procurar no corpo da
tabela o valor de Z
o
correspondente, onde encontramos Z
o
= -2.87
Logo, 650 . 135
000 . 5
000 . 150
87 . 2 =

=
o
o
X
X
, isto , a garantia deve
ser de 135.600 km.

Exemplo: Um perito utilizado em julgamento de paternidade testifica que a extenso
(em dias) da gestao humana normalmente distribuda com parmetros = 270 e
X
Z

50

o
2
= 100. O ru capaz de provar que estava fora do pas durante um perodo que
comeou 290 dias antes do nascimento da criana e terminou 240 dias depois do
nascimento.
Seja X a extenso da gestao e suponha que o ru o pai. Ento a
probabilidade de que o nascimento pudesse ocorrer dentro do perodo indicado
= < + > = < > ) 240 ( ) 290 ( ) 240 290 ( X P X P X ou X P
=

< +

< = )
10
270 240
( )
10
270 290
( Z P Z P
0241 . 0 ) 3 ( ) 2 ( ~ < + < = Z P Z P
Exemplo: Um fabricante de baterias sabe, por experincia passada, que baterias de sua
fabricao tem vida mdia de 600 dias e desvio padro de 100 dias, sendo que a
durao tem aproximadamente distribuio normal. Oferece uma garantia de 312
dias, isto , troca as baterias que apresentarem falhas nesse perodo. Fabrica 10.000
baterias mensalmente. Quantas dever trocar pelo uso da garantia, mensalmente?
Seja X = {durao da bateria} onde X ~ N(600; (100)
2
)
Temos ento ) 1 , 0 ( ~
100
600 ) (
N
X X
Z

=

=
o


001988 . 0 ) 88 . 2 ( )
100
600 312
( ) 312 ( = < =

< = < Z P Z P X P
que a probabilidade de uma bateria durar menos de 312 dias.
Como a fabrica produz 10.000 baterias por ms, o valor esperado de uma distribuio
binomial np, logo, deveremos substituir mensalmente: 10.000*0.001988 ~ 20
baterias.


A Aproximao Normal para a Distribuio Binomial
Um importante resultado na teoria da probabilidade, conhecido como o teorema
limite de DeMoivre-Laplace, diz que, quando n grande, uma varivel aleatria
binomial com parmetros n e p tem aproximadamente a mesma distribuio que uma
varivel aleatria normal com mdia e varincia iguais aquelas da distribuio
binomial. Esse resultado foi provado originalmente por DeMoivre em 1733 para o
caso especial em que p = e foi depois estendido por Laplace em 1812 para o caso de
p qualquer. O teorema diz formalmente que se padronizarmos a distribuio
binomial primeiramente subtraindo desta distribuio sua mdia np e ento dividindo
o resultado por seu desvio padro ) 1 ( p np , ento a funo distribuio dessa
varivel aleatria padronizada (que tem mdia 0 e varincia 1) convergir para a
funo distribuio normal a medida que n .


Teorema Limite de DeMoivre e Laplace
Se S
n
representa o nmero de sucessos que ocorrem quando n tentativas
independentes, cada uma com probabilidade p, so realizadas, ento, para qualquer
a < b,
) ( ) (
) 1 (
a b b
p np
np S
a P
n
| | =

s
a medida que n , sendo | ~ N(0,1).


51

O teorema anterior apenas um caso especial do teorema do limite central, que
iremos discutir a seguir, no vamos apresentar sua demonstrao.

Nota: Para empregarmos a aproximao normal, note que, como a varivel
aleatria binomial uma varivel aleatria discreta inteira, enquanto que a varivel
aleatria normal uma varivel contnua, melhor escrevermos P[X = i] como sendo
P[i < X < i + ] antes de aplicarmos a aproximao normal (isso chamado de
correo de continuidade).

Exemplo: O tamanho ideal de uma turma de primeiro ano em uma faculdade
particular de 150 alunos. A faculdade, sabendo de experincias anteriores que, em
mdia, apenas 30% dos alunos aceitos vo de fato seguir o curso, usa a prtica de
aprovar os pedidos de matrcula de 450 estudantes. Calcule a probabilidade de que
mais de 150 estudantes de primeiro ano freqente as aulas nesta faculdade.

Se X representa o nmero de estudantes que seguem o curso, ento X uma
varivel aleatria binomial com parmetros n = 450 e p = 0,3. Usando a correo de
continuidade, vemos que a aproximao normal resulta em
{ } ~


>

= >
) 7 . 0 )( 3 . 0 )( 450 (
) 3 . 0 )( 450 ( 5 , 150
) 7 . 0 )( 3 . 0 )( 450 (
) 3 . 0 )( 450 (
5 , 150
X
P X P
0559 . 0 ) 59 . 1 ( ~ > ~ Z P
Com isso, menos de 6% das vezes mais de 150 dos 450 estudantes aceitos vo
de fato seguir o curso.

Exemplo: Um sistema formado por 100 componentes, cada um dos quais com
confiabilidade de 0.95 (probabilidade de funcionamento do componente durante um
certo perodo de tempo).
Se esses componentes funcionam independente um do outro e se o sistema completo
funciona adequadamente quando pelo menos 80 componentes funcionam, qual a
confiabilidade d sistema?

Seja X ={nmero de componentes que funcionam}, ento X ~ Bin(100; 0.95)
Queremos ento P(80 X 100)
Aproximando pela distribuio normal e usando a correo de continuidade
temos
= np = (100)(0.95) = 95
o
2
= np(1-p) = (100)(0.95)(0.05) = 4.75 o = 2.18
{ } 993132 . 0 ) 52 . 2 11 . 7 ( 5 , 100 5 . 79 ~ s s = s s Z P X P


Teorema Central do Limite
Sejam X
1
, X
2
, ......, X
n
variveis aleatrias independentes tais que
i i
X E = ) ( e
2
) (
i i
X V o = , ambas finitas. Seja Y = X
1
+ X
2
+ ......+ X
n
. Ento, sob condies bastante
gerais podemos afirmar que:

=
=

=
n
i
i
n
i
i
Y
Z
1
2
1
o



52

tem aproximadamente uma distribuio N(0,1). Esta aproximao torna-se cada vez
melhor a medida que n (o tamanho da amostra) cresce.


Teorema Central do Limite (verso i.i.d.)
Sejam X
1
, X
2
, ......, X
n
variveis aleatrias independentes e identicamente distribudas
(i.i.d.) tais que = ) (
i
X E e
2
) ( o =
i
X V , ambas finitas. Seja Y = X
1
+ X
2
+ ......+ X
n
.
Ento, sob condies bastante gerais podemos afirmar que:

2
o

n
n Y
Z

=
tem aproximadamente uma distribuio N(0,1). Esta aproximao torna-se cada vez
melhor a medida que n (o tamanho da amostra) cresce.


Teorema Central do Limite (verso i.i.d. em termos da mdia amostral)
Sejam X
1
, X
2
, ......, X
n
variveis aleatrias independentes e identicamente distribudas
(i.i.d.) tais que = ) (
i
X E e
2
) ( o =
i
X V , ambas finitas. Seja
i
n
i
X
n
X

=
=
1
1
a
mdia amostral. Ento, sob condies bastante gerais podemos afirmar que:

|
|
.
|

\
|
=

=
o

o
X
n
n
X
Z
/
2

tem aproximadamente uma distribuio N(0,1). Esta aproximao torna-se cada vez
melhor a medida que n (o tamanho da amostra) cresce.


Teorema: Seja X uma varivel aleatria com mdia e varincia o
2
, e seja X
1
, ......, X
n

uma amostra aleatria de tamanho n de X. Ento,

n
X V e X E
2
) ( ) (
o
= =

= = + + = =

=
n
n
X E X E
n
X E
n
X E
n
n
i
i
)} ( ... ) ( {
1
) (
1
) (
1
1

2
2
2
2
1
2
1
2
)} ( ... ) ( {
1
) (
1
) (
n n
n
X V X V
n
X V
n
X V
n
n
i
i
o o
= = + + = =

=


Exemplo: O peso de um saco de caf uma varivel aleatria que tem distribuio
normal com mdia de 65 kg e desvio padro de 4 kg. Um caminho carregado com
120 sacos. Pergunta-se qual a probabilidade de a carga do caminho pesar
a) Entre 7893 kg e 7910 kg?
b) Mais de 7722 kg?

X
i
= {peso de um saco de caf} X
i
~ N(65; 16); i=1,2,3,....,120
X = {peso da carga do caminho}
i
i
X X

=
=
120
1

Assim,
1920 16 ) ( 7800 65 ) (
120
1
120
1
= = = =

= = i i
X V e X E

53

logo, ) 1920 ; 7800 ( ~ N X
a) =
|
|
.
|

\
|
< <

= < <
1920
7800 7910
1920
7800 7893
) 7910 7893 ( Z P X P
010966 , 0 ) 51 , 2 12 , 2 ( = < < Z P
b) 962462 , 0 ) 78 , 1 (
1920
7800 7722
) 7722 ( = > = |
.
|

\
|
> = > Z P Z P X P

Exemplo: Suponha que X represente o peso real de pacotes de caf, enchidos
automaticamente por uma mquina. Considere X ~ N(500,100) isto , X pode ser
representada por uma normal, com parmetros =500 e o
2
=100. Colhendo-se uma
amostra de n = 100 pacotes e pesando-os, X ter uma distribuio normal com mdia
500 e varincia 100/100=1. Considerando que a mquina esteja regulada, qual a
probabilidade de encontrarmos a mdia de 100 pacotes diferindo de 500g de menos
de 2 gramas?
= < < = < ) 502 498 ( ) 2 | 500 (| X P X P
95 . 0 ) 2 2 ( )
1
500 502
1
500 498
( ~ < < =

< <

= Z P Z P


Distribuio Qui-Quadrado
Uma varivel aleatria Y, com valores positivos, tem uma distribuio qui-quadrado
com v graus de liberdade (denotada por _
2
(v)), se sua densidade for dada por
0 ,
2 ) 2 / (
1
) (
2
1
2
2 /
>
I
=

y e y
v
y f
y v
v

onde 0 , ) (
1
> = I

}
o o
o
dx x e
x
o
a funo gama, importante em muitas reas da
matemtica. Pode-se mostrar que ) 1 ( ) 1 ( ) ( I = I o o o e que se n = o for um
inteiro positivo, )! 1 ( ) ( = I n n e que . ) 2 / 1 ( , 1 ) 1 ( t = I = I

Chamamos de Graus de liberdade o nmero de determinaes independentes
(dimenso da amostra) menos o nmero de parmetros estatsticos a serem avaliados
na populao.

Pode-se mostrar tambm que E(Y) = v e V(Y) = 2v.

Da mesma forma que na distribuio normal, os valores da distribuio qui-quadrado
encontram-se tabelados.

A tabela da distribuio qui-quadrado fornece valores de
2
o
_ tais que
o _ _
o
= > ) (
2 2
P , para alguns valores de o e de v conforme ilustrado no grfico
abaixo.
Exemplos:


54

Usando a tabela da distribuio qui-quadrado para v =10 observe que P(Y > 2.558)
= 0,99, ao passo que P(Y > 18,307) = 0,005.

Para o caso em que se queira P(Y < 15,987) = 1 P(Y >15,987) = 1 0.1 = 0.9.

Para o caso em que se queira P(Y > 14,150) podemos observar que este valor no
existe na tabela. Com o auxilio de algum software estatstico, ou at mesmo do Excel,
podemos verificar que o valor para P(Y > 14,150) ~ 0,1663. Por outro, a tabela fornece
que P(Y > 9,342) = 0,5 e P(Y > 15,987) = 0,1. Como 14,150 e(9,342; 15,987) pode-se,
atravs de um chute educado, estimar para P(Y > 14,150) qualquer valor dentro
deste intervalo.
Observaes:
1- Para v > 30 podemos usar uma aproximao normal a distribuio qui-quadrado.
Especificamente, temos o seguinte resultado: se Y tiver distribuio qui-quadrado
com v graus de liberdade, ento a varivel aleatria
) 1 , 0 ( ~ 1 2 2 N v Y Z =
Por exemplo, consultando a tabela da distribuio qui-quadrado para v = 30,
P(Y > 40,256) = 0,10,
Enquanto que, usando a expresso acima, temos que
292 , 1 1 ) 30 ( 2 ) 256 , 40 ( 2 = = Z
e P(Z > 1,292) ~ 0,099, que resulta em uma boa aproximao.

2- Considere Z ~ N(0,1) e considere a varivel aleatria Y = Z
2
. Pode-se mostrar que
) 1 ( ~
2
_ Y , ou seja, o quadrado de uma varivel aleatria com distribuio normal
padro uma varivel aleatria com distribuio _
2
(1). De um modo mais geral,
uma varivel aleatria _
2
(v) pode ser vista como a soma de v normais padres ao
quadrado, independentes.


Distribuio t de Student
O qumico e estatstico ingls William Sealy Gosset (1876 1937) trabalhava na
cervejaria Guiness em Dublin e aplicava seus mtodos estatsticos (que
frequentemente se utilizavam em amostras pequenas) para selecionar as melhores
variedades de cevada. Como a cervejaria proibia que seus funcionrios publicassem
artigos cientficos para proteger seus segredos industriais, Gosset publicou seus
resultados sob o pseudnimo Student. Um de seus resultados foi a determinao da
distribuio t (que ficou conhecida com t de Student), publicada em 1908.

Se X
1
, X
2
, ......., X
n
so amostras aleatrias de uma N( , o
2
), sabemos que a quantidade

n
X
/ o


distribuda como uma varivel aleatria N(0,1). Se conhecermos o valor de o e
medirmos X (a mdia amostral), ento poderemos utilizar a expresso acima como
uma base sobre a inferncia de (a mdia populacional), uma vez que seria ento a
nica quantidade desconhecida. Na maior parte das vezes, no entanto, o
desconhecido. Student fez o bvio ele considerou a distribuio

n s
X
/



55

uma quantidade que poderia ser utilizada como base para a inferncia sobre quando
o era desconhecido.
A distribuio acima fcil de derivar, desde que primeiro observemos algumas
manobras de simplificao. Multiplique a expresso acima por o/o e rearranje de
algum modo para obter

2 2
/
) / )( (
/
o
o
s
n X
n s
X
=


O numerador a varivel aleatria N(0,1), e o denominador ) 1 /(
2
1

n
n
_ ,
independente do numerador. Assim, a distribuio
n s
X
/

nos d a distribuio t-
Student.

Definio: Sejam X
1
, X
2
, ......., X
n
uma amostra aleatria de uma distribuio N( , o
2
).
A quantidade
n s
X
/

tem a distribuio t-Student, com n-1 graus de liberdade. De
modo equivalente, uma varivel aleatria T tem a distribuio t-student com p graus
de liberdade, e escrevemos T ~ t
p
se sua f.d.p. for:

( )
( )
< <
+
|
.
|

\
|
I
|
.
|

\
| +
I
=
+
x
p t
p
p
p
t f
p
,
/ 1
1 1
2
2
1
) (
2 / ) 1 (
2
2 / 1
t

Pode-se provar que 1 , 0 ) ( > = p se t E e que 2 ,
2
) ( >

= p se
p
p
t V
O grfico da densidade de t aproxima-se de uma N(0,1) quando v (graus de liberdade)
grande, como mostrado abaixo:



Como esta distribuio bastante utilizada na prtica, existem diversas tabelas
fornecendo probabilidades relativas a ela.
Exemplos:

56

1- Seja uma distribuio de Student com seis graus de liberdade (v = 6). Encontre
P(t(6) > 2,447).
Se olharmos na tabela ao final desta apostila podemos verificar que a mesma
nos fornece valores para P(t > t
o
) = o , logo, a probabilidade de P(t(6) > 2,447)
= 0.025.
2- Qual seria a probabilidade para P(-1,943 < t(6) < 1,943)?
Devemos observar que a tabela unilateral e simtrica. Pela tabela temos que
P(t(6) > 1,943) = 0,05. Logo, pela simetria, P(t(6) < -1,943) = 0,05. Dessa forma,
P(-1,943 < t(6) < 1,943) = 1-(0,05+0,05) = 0,90.
3- Considere agora uma distribuio de Student com oito graus de liberdade (v = 8).
Encontre P(t(8) > 1,654).
Podemos observar que para este grau de liberdade no existe este valor na tabela.
Com o auxilio de algum software estatstico, ou at mesmo do Excel, podemos
verificar que o valor para P(t(8) > 1,654) ~ 0,0683. Por outro, a tabela fornece que
P(t(8)> 1,397) = 0,1 e P(t(8) > 1,860) = 0,05. Como 1,654 e(1,397; 1,860) pode-se,
atravs de um chute educado, estimar para P(Y > 1,654) qualquer valor dentro
deste intervalo.
4- Seja X ~ N(, o
2
). Tome uma amostra aleatria de X com n = 8. Calcule e compare
a) ) 2 / ( o > X P com b) ) 2 / ( s X P >
a. Como ) 1 , 0 ( ~
8 /
N
X
Z
o

= temos
07927 , 0 ) 2 (
2
8
8 /
) 2 / ( = > =
|
|
.
|

\
|
>

= > Z P
X
P X P
o

o
b. Como ) 7 ( ~
8 /
t
s
X
t

= , temos
0,09810 ) 2 ) 7 ( (
2
8
8 /
) 2 / ( = > =
|
|
.
|

\
|
>

= > t P
s
X
P s X P


Podemos notar que as duas probabilidades so significativamente diferentes.
No entanto, se o desconhecido, impossvel verificar se o evento em (a) acontece
ou no enquanto o evento em (b) no depende de o para absolutamente nada!


Distribuio F de Snedecor
O nome desta distribuio vem de George W. Snedecor (1881 1974), um matemtico
e fsico americano especialmente interessado em experimentos biolgicos e agrcolas.

Definio: Sejam X
1
, X
2
, ......., X
n
uma amostra aleatria de uma populao
) , (
2
x x
N o , e que Y
1
, Y
2
, ......., Y
m
seja uma amostra aleatria de uma populao
independente ) , (
2
y y
N o . A varivel aleatria
2 2
2 2
/
/
y y
x x
s
s
o
o
tem distribuio F de Snedecor

57

com n-1 e m-1 graus de liberdade. De forma equivalente, a varivel aleatria F tem a
distribuio F com p e q graus de liberdade se sua f.d.p. for
< <
+
|
|
.
|

\
|
|
.
|

\
|
I
|
.
|

\
|
I
|
.
|

\
| +
I
=
+

x
q p
x
q
p
q p
q p
x f
q p
p
p
,
)] / ( 1 [
2 2
2
) (
2 / ) (
1 ) 2 / (
2 /

A derivao da f.d.p. de F, comeando a partir de distribuies normais, similar a
derivao de t-student. Na verdade, em algum caso especial, a F a transformada de t.
Teoremas:
a. Se X ~ F.p.
,q
, ento 1/X ~ F
q,p
; isto , a recproca de uma varivel aleatria F
novamente uma varivel aleatria F.
b. Se X ~ t
q
, ento X
2
~ F
1,q
.

Pode-se provar que
2
) (

=
q
q
F E e que
) 4 ( ) 2 (
) 2 ( 2
) (
2
2

+
=
q q p
q p q
F V

O formato da distribuio F(m, n) varia com m e n. A maioria da tabelas para a
densidade F unicaudal para diversos valores de significncia o. Pode-se representar a
distribuio F na figura abaixo:

Ao final desta apostila apresentamos a tabela da distribuio F para o = 5% e o = 2.5%.

Exemplos:
a. Considere a varivel aleatria W ~F(5, 7). Consultando a tabela para o = 5%
temos P(F > 3.97) = 0.05 e P(F < 3.97) = 0.95.
Digamos agora que queremos encontrar o valor f
0
tal que
. 05 . 0 ) (
0
= < f F P Podemos ento escrever:
);
1
) 5 , 7 ( (
) 5 , 7 (
1
) ) 7 , 5 ( ( 05 . 0
0
0 0
f
F P f
F
P f F P > =
)
`

< = < =
Na tabela para F(7, 5) encontramos o valor 4,.88. Logo
. 205 , 0 88 . 4
1
0
0
= = f
f

b. Seja X uma varivel aleatria com densidade F(4, 10). Ache os pontos a e b
tais que P(a < X < b) = 0,95.

58

A probabilidade de X estar fora do intervalo 5%, e escolhemos a e b tais
que, a probabilidade de X estar abaixo de a 2,5%, e a probabilidade de X
estar acima de b tambm 2,5%.
Assim, b encontrado fazendo-se:
47 , 4 025 , 0 ) ) 10 , 4 ( ( 025 , 0 ) ( = = > = > b b F P b X P
De maneira semelhante, a tal que:
= < = < 025 , 0 )
1 1
( 025 , 0 ) (
a X
P a X P
= < = < 025 , 0 )
1
) 4 , 10 ( ( 025 , 0 )
1
(
a
F P
a
Y P
84 , 8 ) 4 , 10 ( 025 , 0 )
1
) 4 , 10 ( ( 1 = = > F
a
F P
0,113 84 , 8 / 1 84 , 8
1
= = = a
a

Assim: P( 0,113 < X < 4,47) = 0,95 onde X ~ F(4, 10).























59













60







61










62

Distribuio Qui-Quadrado

O corpo da Tabela que fornece valores c tais que P(_
n
>c)=p, onde n o
nmero de graus de liberdade






63





64







65

You might also like