You are on page 1of 28

BIOESTATSTICA

Parte 3 Variveis Aleatrias

Aulas Tericas de 29/03/2011 a 26/04/2011


3.1. Conceito de Varivel Aleatria. Funo de Distribuio

Variveis aleatrias

Uma varivel aleatria pode ser entendida como uma varivel quantitativa
[numrica], cujo valor depende de factores aleatrios, isto , cujo valor resulta de um
processo em que intervm o acaso.

Exemplos:

Nmero obtido no lanamento de um dado;


Nmero de comprimidos defeituosos numa amostra retirada de um lote e
nmero de indivduos infectados pelo vrus da gripe duma dada regio, num
certo perodo de tempo;
Volume de gua perdido, por dia, num sistema de abastecimento;
Tempo de vida de um ser vivo de certa espcie.

A uma experincia aleatria pode-se associar um modelo de probabilidade que


pressupe a construo de um espao de resultados e a atribuio de uma
probabilidade a cada um dos acontecimentos elementares. Ora, nem sempre os
resultados de uma experincia aleatria so numricos (e.g. lanamento de uma
moeda: cara ou coroa). [neste caso atribui-se valores a cara e a coroa, transformando a
varivel em numrica].

Alm disso, frequentemente prefervel sintetizar os aspectos mais significativos


dos resultados das experincias aleatrias atravs da definio de uma varivel.

Ex: lanamento de uma moeda equilibrada = {cara, coroa}

X varivel aleatria indicatriz do acontecimento A = {coroa}

A varivel indicatriz indica se o acontecimento se


realizou. X=0 se A se realiza e X=1 se B se realizou, etc.

Ento: P(X=0) = P(sair cara) = e P(X=1) = P(sair coroa) =

Ex: So escolhidos ao acaso 100 comprimidos de um grande lote e observa-se se cada


comprimido defeituoso ou no defeituoso.

O espao de resultados constitudo por 2100 elementos! mais conveniente


definir a varivel X nmero de comprimidos defeituosos (ou no defeituosos) em
100. Para representar variveis aleatrias usam-se letras maisculas do final do
alfabeto: X, Y, Z, W Se X for uma varivel aleatria (v.a.) representamos por x
(minsculo) um valor observado dessa v.a., ou seja, um valor que a v.a. pode assumir

[note-se que se usam letras maisculas do inicio do alfabeto para representar


acontecimentos]

Varivel aleatria X valor observado x


[varivel aleatria Y valor observado y]

As variveis aleatrias podem ser classificadas como discretas ou como


contnuas.

Uma v.a. diz-se discreta se apenas assume um nmero finito ou infinito


numervel de valores distintos. [associado a contagens]

Exemplos:
Nmero obtido no lanamento de um dado;
Nmero de comprimidos defeituosos numa amostra retirada de um lote.

Uma v.a. diz-se contnua se pode assumir qualquer valor de um intervalo da recta
real, sendo nula a probabilidade de assumir um valor especfico. [associado a
medies]

Exemplos:

Nvel de glicose no sangue de um individuo numa dada populao;


Tempo at ser atingida a concentrao mxima de um frmaco na circulao
sistmica.

Se X uma via contnua ento:

P(X = ) = 0 para qualquer real 



  
  ]
   
[De forma no rigorosa, pode-se pensar: P(x=) =

[Para variveis contnuas calcula-se a probabilidade de intervalos de valores, por


exemplo, P(X ), P(X  ), P( X  )]

Funo de Distribuio
Uma forma de definir uma varivel aleatria, discreta ou indiscreta, consiste na
utilizao de uma funo real de varivel real [  ] designada por funo de
distribuio.

Funo de distribuio (f.d.) de uma varivel aleatria X (discreta ou contnua)


a funo definida por:

F() = P(X  ) para qualquer   

domnio

A funo de distribuio cumulativa, representa a probabilidade acumulada


at x. Notemos que 0 F()  1.

[Apesar de ser possvel calcular f.d. para variveis contnuas e discretas, o seu clculo
diferente para umas e outras. Esta funo mais interessante para variveis contnuas,
pois em alguns destes casos assume uma expresso analtica. Para variveis discretas
soma-se a probabilidade at ao ponto x (semelhante s frequncias acumuladas) e
para variveis contnuas calculam-se atravs de integrais interpretao atravs de
reas]

Seja X uma v.a. com f.d. F(X). Ento, dados os pontos a e b, tais que a  b, tem-
se que:

P(     F(b) F(a)

O conhecimento da funo de distribuio possibilita, de forma expedita, o


clculo da probabilidade de uma v.a. assumir valores num dado intervalo. Notemos
que, se a v.a. for contnua:

P(a  X  b) = P(a  X  b) = P(a  X  b) = P(a  X  b) = F(b) F(a)

Se a v.a. X for contnua estas probabilidades so todas iguais! [o que no


verdade para variveis discretas].

3.2. Variveis Aleatrias Discretas. Funo Massa de


Probabilidade
natural definir a probabilidade de uma varivel aleatria assumir um
determinado valor como sendo a probabilidade do acontecimento que fez com que a
v.a. tivesse esse valor.

Chama-se funo massa da probabilidade (f.m.p.) funo que, a cada valor


numrico que a v.a. assume, faz corresponder a probabilidade associada a esse valor.
Uma v.a. X discreta fica perfeitamente identificada pela sua f.m.p., ie, pelos valores de
x que a v.a. pode tomar e pelas probabilidades com que assume cada um desses
valores.
xi
X=
P(i) = P(x=xi)

Atendendo definio de probabilidade, imediato que qualquer f.m.p., goza


das seguintes probabilidades:

1. Pi 0
2.   = 1

-1 0 1 2
X= a = 0,2
0,3 0,1 a 0,4

[Ex: lanamento de uma moeda:

0 1 x 0 1
X=
ou P(X=x)

Nota: s se inserem nas tabelas os valores com probabilidade no nula]

Ex: Uma urna que contm 4 bolas numeradas de 1 a 4. Extraem-se ao acaso 2 bolas de
uma urna. Defina a v.a. que representa a soma dos nmeros observados nas bolas
extradas.

(i) Supondo que a extraco feita com reposio:

= {(1,1), (1,2), (1,3), (1,4), (2,1), (2,2), (2,3), (2,4), (3,1), (3,2), (3,3),
(3,4), (4,1), (4,2), (4,3), (4,4)}

2 3 4 5 6 7 8
X=
" ! "# $" "% $" "# " !
% !

(ii) Supondo que a extraco feita sem reposio:


= {(1,2), (1,3), (1,4), (2,1), (2,3), (2,4), (3,1), (3,2), (3,4), (4,1), (4,2), (4,3)}

3 4 5 6 7
X=
"! "! "$ "! "!
3.3. Variveis Aleatrias Contnuas. Funo Densidade de
Probabilidade
Define-se funo densidade de probabilidade (f.d.p.) de uma varivel aleatria
X contnua r representa-se por f(x) como sendo a derivada, se existir, da funo de
distribuio F(x). [note-se que f.d. representa-se por letras maisculas e f.d.p. por
letras minsculas]

()'
&'  
(
O que equivalente a:
,

)'   * &'(+
-

visto que F(-.  

Notao que significa limite

[O domnio ]-./ ] explicado pois F(x) = P(X  ) P'01 2 ./ 1

f.m.p. da funo discreta a correspondente f.d.p. da varivel aleatria contnua]

Nos pontos em que no existe derivada de f.d., habitual considerar que f(x) =
0. Quando a v.a. assume valores apenas num subconjunto de , admite-se que f(x) = 0
no exterior daquele subconjunto.

Propriedades de f.d.p.:

1) &'  3
5
2) 4- &'('  [ A = 1]

[A funo densidade de probabilidade est sempre acima dos eixos dos xx. Possveis
grficos:
Notemos que para   :
6

* &'(  )' 2 )'  '    




O clculo do integral anterior equivalente a calcular o valor da rea


compreendida entre o eixo das abcissas, o grfico da f.d.p. e as rectas x = a e x = b.

P(    ) = P(    ) visto


que P(   ) = 0

3.4. Caractersticas Populacionais

[ - nunca so aleatrios; - representados com frequncia por


- por vezes so desconhecidos; letras gregas]
Valor Mdio
[corresponde mdia]

[ uma espcie de mdia ponderada]

[ou seja, quando a srie convergente]

[E(X) um valor no obtido no lanamento do dado, mas no se arredonda]


Valor mdio de uma funo de uma varivel aleatria

Propriedades do valor mdio:

[visto que E(b) =

Quantil de probabilidade p (0 < p < 1)


[Exemplo:

Nota: grfico representa f.d.p.

Quantil de probabilidade 0,3 = b

p = F(b) = 0,3]

Varincia (populacional)
Desvio Padro (populacional)

Coeficiente de Variao (populacional)

Exemplo do clculo do valor mdio e varincia de uma varivel aleatria discreta


Par aleatrio Discreto

  7  8

[ a soma das probabilidades zero]

Exemplo:
Variveis Aleatrias Independentes:

[,=7]

[Nota: A e B so independentes se e s se P(A 7 B) = P(A) . P(B)]

[se existir apenas um par de valores em que a condio no se verifica as variveis so


dependentes;
Variveis cuja interseco de um par de valores zero no so independentes]

Covarincia
[cov (X,Y) = 0 no implica que as v.a. sejam independentes, mas cov (X,Y) 0 implica
que as variveis no sejam independentes]

Coeficiente de Correlao
Soma de Variveis Aleatrias
3.5. Modelos Discretos: binomial, Poisson e hipergeomtrica

Vamos agora estudar alguns modelos probabilsticos com grande aplicao na


prtica.

Modelo Binomial

Consideremos uma experincia aleatria com as seguintes caractersticas:

A experincia constituda por n provas, entendendo-se por prova uma


repetio em condies idnticas;
So provas independentes;
Em cada prova ocorre apenas um de dois resultados possveis [estuda-se
apenas um acontecimento], designados por sucesso ou insucesso. A
probabilidade de sucesso mantm-se constante de prova para prova e
representa-se por p [letra minscula].

[sucesso ocorreu o acontecimento estudado;


Insucesso no ocorreu o acontecimento estudado]

Uma sucesso de provas com estas caractersticas designa-se por sucesso de


provas de Bernoulli:

Exemplos:

Lanamento de uma moeda: cara (sucesso), coroa (insucesso) [quer seja a


moeda equilibrada ou no];
Observao de comprimidos de um lote: comprimido defeituoso (sucesso),
comprimido no defeituoso (insucesso);
Resultado de um tratamento para uma certa doena aplicado a pacientes em
condies bem definidas: paciente curado (sucesso), paciente no curado
(insucesso) [a independncia resulta da escolha dos pacientes ser aleatria].
Seja X a v.a. que representa o nmero de sucessos em n provas de Bernoulli e
em que a probabilidade de sucesso p. Ento a f.m.p. :
:
P (X = K) = 9 < pK (1-p)n-K
;
K = 0, 1, 2, , n

[equivalente a CDE ] [Nmero de sucessos]

X uma v.a. binomial de parmetros n e p e representa-se por:

X 7 Bi (n, p)

[no uma interseco;


L-se X tem distribuio binomial de parmetros n e p]

[Exemplo:

Foram feitos 3 lanamentos de uma moeda no equilibrada:


= 
P(cara = F) = > P(coroa = C) = >

X nmero de coroas que saem em 3 lanamentos

= > ? =  = B
P(X=0) = 9>< = P(X=2) = $ A  >  A  9><   =@
=@

= =  =  > 
P(X=1) = $ A  9>< A  >   =@ P(X=3) = 9>< = =@

Recordar que:
: :G G 
CDE   9 <  
F FG': 2 FG

Mostra-se que:

E(X) = np e var(X) = np (1-p)

[Nmero mdio de sucessos em n provas]

Caso particular: quando n=1, X designado por v.a. de Bernoulli

[ a varivel indicatriz]
Amostragem com reposio:

Consideremos o processo de amostragem em que, para cada indivduo


recolhido aleatoriamente na populao, se verifica se tem ou no uma determinada
caracterstica, repondo o elemento antes de proceder a uma nova extraco. Ento,
estamos em condies de aplicar o modelo Binomial quando ser quer estudar a v.a.
que representa o nmero de indivduos da amostra assim obtida que tm a dita
caracterstica.

[mesmo que no se faa reposio em determinadas condies pode-se utilizar o


modelo binomial, se a dimenso da amostra for muito superior probabilidade
considerada]

Soma de v.a. independentes com distribuio binomial:


Dadas as v.a.  / H / D independentes com distribuio binomial
Xi 7 Bi (ni, p), i=1, , k
A soma Sk= X1 + + Xk tambm tem distribuio binomial
D

I 7 JK LM : / OP K  / H / F
N
[para isto ser vlido o parmetro p tem de ser igual para todas as v.a.
Exemplo: lanamento de uma moeda. Seja:
X1 nmero de caras em 5 lanamentos;
X2 nmero de caras em 19 lanamentos;
X3 nmero de caras em 3 lanamentos.
Uma vez que as variveis tm a mesma probabilidade p de sucesso, a varivel soma
tambm binomial]

Distribuio Geomtrica

Uma varivel aleatria X diz-se geomtrica de parmetros p se representar o


nmero de provas necessrias at obteno do primeiro sucesso (inclusive), numa
sucesso de provas de Bernoulli em que a probabilidade de sucesso p.

[ um caso particular de uma outra distribuio Distribuio Binomial Negativa em


que se considera o nmero de provas necessrias at obteno do ensimo sucesso
(terceiro, quinto, dcimo )]

A f.m.p. de X dada por:

P(X = k) = p (1-p)k-1 k = 1, 2, [ K  [1, .[ ]


Mostra-se que:
 -
Q
E(X) = Var(X) =

[Exemplo: Numa urna esto 20 bolas, das quais 5 so brancas. Qual a probabilidade de
a bola branca sair pela primeira vez terceira extraco?

  >- S
P(X=3) = R  A  9 2  R<   BR

Neste exemplo, E(X) = 4]

Distribuio Poisson

Vamos agora considerar um modelo discreto que se aplica em situaes em


que interessa estudar o nmero de ocorrncias de um certo acontecimento, num
determinado intervalo de tempo ou regio do espao.

[ex: nmero de chamadas recebidas num call center em 15 minutos]

Suponham-se que se verificam as seguintes hipteses (processo de Poisson):

A ocorrncia do acontecimento num determinado intervalo independente da


ocorrncia do acontecimento em qualquer intervalo distinto;
A probabilidade de exactamente uma ocorrncia do acontecimento em
qualquer intervalo de amplitude h arbitrariamente pequeno Th;
A probabilidade de duas ou mais ocorrncias do acontecimento em qualquer
intervalo de amplitude h aproximadamente 0.

Seja X a varivel aleatria que representa o nmero de ocorrncias do


acontecimento num intervalo unitrio [seja 15 minutos, 1 cm3, ou outro intervalo
considerado]. Ento dizemos que T tem distribuio de Poisson de prametro T com
f.m.p. dada por:

VW
'  F   U -D k = 0, 1, 2, T  
DG

Representa-se por X 7 P(T)

O parmetro T o nmero mdio de ocorrncias por intervalo de tempo:

E(X) = T e var(X) = T

[no exemplo acima T o nmero mdio de chamadas recebidas em 15 minutos]


Exemplos de aplicao da distribuio de Poisson:
Nmero de novos casos de hepatite numa certa regio num ms;
Nmero de clientes que chegam a um balco de atendimento num certo
intervalo de tempo;
Nmero de erros de impresso por pgina de livro;
Nmero de chamadas telefnicas recebidas num call center numa hora;
Nmero de bactrias num determinado volume.

Cada intervalo unitrio dividido em h subintervalos, de modo que cada


subintervalo tenha uma amplitude arbitrariamente pequena. Ento em cada um
desses subintervalos:
V
X
A probabilidade de exactamente uma ocorrncia do acontecimento ;
A probabilidade de 2 ou mais ocorrncias do acontecimento
aproximadamente 0;

Ento, a probabilidade de k ocorrncias do acontecimento no intervalo para k


fixo.

[ou seja, ou ocorre o acontecimento ou no ocorre nada, como na distribuio


binomial.

: T D T E-D
P(X=k) Y 9 < 9 < 9 2  <
F : :
Se n  ., tem-se
E
:': 2  H ': 2 F ]  TD T T -D
Z[\  ^ 2  _ ^ 2 _  ` U -V `
E :D FG : :

A distribuio Binomial Bi(n,p) converge para a distribuio de Poisson P(T)


quando:

:  . (o nmero de provas aumenta) [a partir de 20 ou 30 provas]


O   (a probabilidade de sucesso tende para zero)
np = T (o nmero mdio de sucesso mantm-se constante de prova para
prova)

O modelo de Poisson surge assim como limite do modelo binomial, nas


condies anteriores, por isso designado por Lei dos Acontecimentos Raros.

Soma de v.a. independentes com distribuio poisson:


Dadas as v.a.  / H / E independentes com distribuio de Poisson
Xi 7 P (T), i=1, , n
A soma Sk= X1 + + Xn tambm tem distribuio de Poisson
D

IE 7  LM T P K  / H / :
N

Distribuio Hipergeomtrica

Quando se procede a extraces sem reposio numa populao finita, o que


podemos dizer quanto varivel aleatria que representa o nmero de elementos da
amostra assim obtida que possuem determinada caracterstica?

Consideremos uma populao de N elementos dos quais M possuem


determinada caracterstica (sucesso), enquanto que os restantes N M no a tm. Seja
n a dimenso de uma amostra extrada da populao (sem reposio) e X a v.a. que
representa o nmero de elementos da amostra que possuem a dita caracterstica.
Ento a v.a. X tem distribuio hipergeomtrica dada por:

a b2a
9 <9 <
'  F   F :2F
b
9 <
:
K = Max. (0, n(N-M)), , min(M,n)

[Exemplo: num lote de 12 caixas de comprimidos sabe-se que 3 esto danificadas e 9


esto normais. Retiraram-se 4 caixas sem reposio. Qual a probabilidade de 2 dessas
caixas serem danificadas?

X nmero de caixas danificadas em 4 retiradas aleatoriamente sem reposio

De quantas maneiras De quantas maneiras posso

$ d
posso retirar 2 caixas em retirar 2 caixas em 9 normais
9 <9 <
'  c   c c  /c #
3 danificadas
c
9 <
%

De quantas maneiras posso


retirar 4 caixas em 12

Nota: sempre necessrio conhecer a distribuio da populao]


Os parmetros so N, n e (que a probabilidade de que um elemento
extrado ao acaso da populao possua a caracterstica).

E(X) = np Var(X) = np (1--p)

O modelo hipergeomtrico adequado quando se procede a extraces sem


reposio:

as extraces no so independentes;
a probabilidade de sucesso varia de extraco para extraco.

No entanto, quando se procede a extraces sem reposio,


reposio, se a dimenso N da
populao
o for muito maior que a dimenso n da amostra, o modelo binomial pode ser
usado para representar o nmero de elementos da amostra que possuem
determinada caracterstica. De facto, neste caso, as sucessivas extraces podem ser
consideradas independentes e a probabilidade de sucesso no se altera
substancialmente de extraco para extraco.

3.6. Modelos Contnuos: uniforme, exponencial, o modelo


gaussiano e o Teorema Limite Central

Distribuio Uniforme

X tem distribuio uniforme no intervalo (a, b) se a sua f.m.p. for dada por:

[Demonstrao:

Funo uniforme f(x) = k se

f(x) = 0 se

(b a)k = 1 k = ]

Simbolicamente, representa-se
representa por X U(a,b).

A funo de distribuio dada por:


eU  
,-
F(x) = 6-
eU    

eU  

Ento, se X 7 U(a,b), temos que:


56
=
E(X) = [se a distribuio for uniforme o valor mdio o ponto mdio]

'6-Q
=
Var (X) =

Distribuio Normal (ou Gaussiana)

A distribuio normal a mais conhecida das distribuies contnuas e uma


das mais importantes.
Do ponto de vista das aplicaes empricas, tem-se comprovado que muitas das
caractersticas observveis de determinada populao so bem representadas por
variveis aleatrias que seguem uma distribuio normal.

Exemplo: distribuio da altura ou do peso dos indivduos em populaes


razoavelmente homogneas.

Por outro lado, prova-se que a distribuio da soma (ou da mdia) de um


nmero suficientemente grande de variveis aleatrias s.i.d.d. [independentes e
identicamente distribudas, ou seja, com o mesmo parmetro] bem aproximada
distribuio normal, o que permite justificar a sua utilizao em muitas situaes. Tem
tambm um papel importante na inferncia estatstica.

Uma v.a. X tem distribuio normal de parmetro f e g se a sua f.m.p. dada


por:

2f =
&'   UO j2 9 < k
ghci c g

  ; f  ; g  +

Se X 7N(f, g), ento E(X)=T e var(X) = g =


Desvio padro

Vejamos algumas propriedades da f.m.p. da normal relativamente sua


representao grfica:
1. simtrica relativamente ao seu valor mdio f, de modo que 2 curvas
correspondentes a 2 distribuies com o mesmo desvio padro g tm a mesma
forma, diferindo apenas na localizao.
2. tanto mais achatada quanto maior o valor de g, de modo que 2 curvas
correspondentes a 2 distribuies com o mesmo valor mdio so simtricas
relativamente ao mesmo ponto f, diferindo apenas quanto ao seu grau de
achatamento.

Para qualquer v.a. X 7N(f, g):

P(f 2 g    f ] g  /!#c!
P(f 2 cg    f ] cg  /dl%%
P(f 2 $g    f ] $g  /ddm$
A distribuio normal com valor mdio f=0 e desvio padro g=1 designada por
distribuio normal standardou padro e representa-se por N(0,1). Se X 7N(f, g),
ento:
 2 f
n   7 b'/ 
g
A funo de distribuio da normal standard tem uma notao especial:
n 7 b'/  'o  n  p'n

X 7N(f, g)
r-s 6-s 6-s q-v
P(X q) = p'   = p'    = u' 
t t t w

2f  2 f  2 f q2v y2v


x'y  z  q  '    u ^ _ 2 u' 
g g g w w

[note-se que o grfico da normal simtrico e que A=1]

[x o quantil do ordem 0,1 F(x) = 0,1

o quantil de ordem 0,5 corresponde


mediana, que igual mdia, porque a
distribuio normal simtrica;

qualquer quantil de ordem menor que


0,5 negativo (numa N(0,1)) ]
Soma de variveis aleatrias independentes com distribuio normal

Se as variveis forem independentes


Soma dos
a varincia (2) da soma a soma das
valores mdios
varincias

[combinao linear = multiplicao por constantes]

Valor Mdio e a Varincia da Mdia

[i.i.d. implica que a variveis tm os mesmos parmetros


Distribuio da Mdia para Populaes Normais

O que sempre verdade seja desconhecido ou no.

[A distribuio t-Student extremamente parecida com a distribuio Normal:


tambm tem forma de sino e simtrica em relao a , mas as caudas so mais
pesadas]

Teorema Limite Central

Distribuio da mdia para populaes no normais


Aplicaes do Teorema Limite Central:

You might also like