You are on page 1of 277

Introduo

Se tomarmos um determinado slido, sabemos que a uma certa temperatura haver a passagem para o estado lquido: Experimento Determinstico. Quais as chances das vendas de uma empresa crescerem? Existem dois resultados possveis: as vendas crescem ou no crescem Experimento Aleatrio.

Experimento Aleatrio
Processo de observao cujo resultado no determinado. O que caracteriza um experimento aleatrio

- A possibilidade de repetio sob as mesmas condies - Os resultados no so determinados a priori - Existncia de regularidade quando o nmero de repeties grande.

Exemplo 1: Experimentos Aleatrios

a) Lanar uma moeda honesta. b) Lanamento de um dado. c) Lanamento de duas moedas. d) Retirada de uma carta de um baralho completo de 52 cartas. e) Determinao da vida til de um componente.

Espao de Resultados: Espao Amostral


Conjunto de todos os possveis resultados de um experimento. Um resultado do espao amostral chamado de evento. Representa-se por . pode ser quantitativo (discreto ou contnuo) ou qualitativo. i) No lanamento de um dado = {1,2,3,4,5,6}. discreto. ii) Observar os momentos de entrada X e sada Y de um cliente de uma loja no perodo 9 19 horas . contnuo. = {(X,Y): 9 < X < Y< 19}

Espaos Amostrais do Exemplo 1


a) = {c, r} b) = {1,2,3,4,5,6} c) = {(c, r), (c,c), (r,c), (r,r)} d) = {A0,...,K0,Ap,...,Kp,AE,..,KE,AC,...,KC} e) = {t / t 0}

Exemplo 2 : Evento Aleatrio


Lanam dois dados iguais. Enumerar os seguintes eventos:
A: sada de faces iguais. B: sada de faces cuja soma seja igual a 10 C: sada das faces cuja soma seja menor que 2 D: sada das faces cuja soma seja menor que 15 E: sada das faces onde uma face o dobro da outra.

Espao amostral do exemplo 2


1 2 3 4 5 6 1 (1,1) (2,1) (3,1) (4,1) (5,1) (6,1) 2 (1,2) (2,2) (3,2) (4,2) (5,2) (6,2) 3 (1,3) (2,3) (3,3) (4,3) (5,3) (6,3) 4 (1,4) (2,4) (3,4) (4,4) (5,4) (6,4) 5 (1,5) (2,5) (3,5) (4,5) (5,5) (6,5) 6 (1,6) (2,6) (3,6) (4,6) (5,6) (6,6)

Os eventos do exemplo 2
A={(1,1),(2,2), (3,3), (4,4), (5,5), (6,6)} B={(4,6), (5,5),(6,4)} C={} D={} E={(1,2),(2,1), (2,4),(3,6),(4,2),(6,3)}

Classe de Eventos Aleatrios


o conjunto formado de todos os eventos (subconjuntos) do espao amostral. Considere como exemplo um espao amostral finito: = {e1,e2,e3,e4} A classe de eventos aleatrios F() 4 0 4 e1,e2,e3,e4 1 4 (e1,e2), (e1,e3), (e1,e4), (e2,e3) , (e2,e4), (e3,e4) 2 4 (e1,e2,e3), (e1,e2,e4), (e1,e3,e4), (e2,e3,e4) 3 4 (e1,e2,e3, e4) 4 O nmero de eventos de um espao amostral F()=2n .

Usando esse espao amostral temos que o nmero de eventos 24

Propriedades com Eventos Aleatrios


Considere = {e1,e2,...,en}. Sejam A e B dois eventos de F(). Operaes
Uunio: A B ={ei / ei A ou ei B }. O evento formado pelos elementos que pertencem a pelo menos um dos eventos.
A B

Propriedades com Eventos Aleatrios


Operaes
Interseo. A B ={ei / ei A e ei B }. O evento formado pelos elementos que pertencem simultaneamente aos dois eventos.
A B

AB

Propriedades com Eventos Aleatrios


Complementao: A = A = {ei /e i A}
A = A
__

__

Exemplo 3:
Lanam-se duas moedas. Sejam A: sada de faces iguais e B=sada de cara na primeira moeda. Determine
a) AB b) AB c) A , B d)A B e) A B f) A B g)A B h) B-A i) A-B

Resoluo do Exemplo 3
a) AB = {(c,c, (c,r), (r,r)} b) AB={(c,c)} d) A B = {(r, c)} e)A B = {(c, r), (r, c), (r, r)} f) A B = {(r, c)} g) A B = {(c, r), (r, c), (r, r)} h) B-A = {(c,r)} i) A-B={(r,r)} = {(c,c), (c,r), (r,r), (r,c)}. A= {(c,c), (r,r)} B= {(c,c), (c,r)}

c) A = {(c, r), (r, c)} B = {(r, c), (r, r)} ,

Propriedades das Operaes


a) Idempontentes: AA=A, AA = A. b) Comutativas: A B=BA, A B=B A c) Associativas: A (B C)= (A B) C A (B C)= (A B) C) d) Distribuitivas: A (B C)= (A B) (A C) A (B C)= (A B) (A C)

Propriedades das Operaes


e) Absores: A (A B)=A, A (A B)=A f) Identidades: A =A, A = A = , A =A g) Complementares: = , = , A A = ,

A A = , ( A ) = A
g) Leis de Morgan (A B) c = A B (A B) c = A B

Partio de um Espao Amostral


A1 A2 A3 A5 A6 A4

Dizemos que os eventos A1,...,An formam uma partio do espao amostral se:
a) A
n i

, i = 1 ,..., n
j

b) A i A c) U A
i =1 i

= ,i j

Eventos Mutuamente Exclusivos


Dois eventos A e B so mutuamente exclusivos se eles no puderem ocorrer simultaneamente, isto AB= Exemplo: No lanamento de um dado A: sada impar e B sada par, ento A: {1,3,5} B: {2,4,6}

Experimentos de Contagem Combinaes


b c a e d

Permite contar o nmero de resultados quando n objetos esto para ser selecionados a partir de um conjunto de N objetos, SEM LEVAR EM CONTA A ORDEM DELES.

N N! C = = n n!( N n )!
N n

Exemplo 4

N=5 e n=2
b c a e d

= { {a,b}, {a,c}, {a,d}, {a,e} {b,c}, {b,d}, {b,e}, {c,d}, {c,e}, {d,e} }
5 2

5 5! C = = 2 2!(5 2)! = 10

Experimentos de Contagem com Permutaes


b c a e d

Permite contar o nmero de resultados quando n objetos esto para ser selecionados a partir de um conjunto de N objetos, LEVANDO EM CONTA A ORDEM DELES.

N N! P = n! = n ( N n )!
N n

Exemplo 5
N=5 e n=2
b c a e d

= { {a,b}, {b,a} {a,c}, {c,a} {a,d}, {d,a}, {a,e}. {e,a} {b,c}, {c,b} {b,d}, {d,b}, {b,e},{e,b} {c,d}, {d,c}, {c,e}, {e,c} {d,e}, {e,d} }
5 P2

5 5! = 2! = 2 (5 2)! = 20

Introduo
1 - Conceito Clssico
Se uma experincia tem N resultados possveis e igualmente provveis e nA o nmero de resultados de um evento A ento a probabilidade de A n P( A ) = A N Exemplos:
Lanamento de um dado. Seja A o evento que registra a sada par.

P(A) =

1 2

Lanamento de uma moeda. Seja A o evento que registra coroa

1 P ( A) = 2

Introduo
2 Conceito Frequentista
Se em N realizaes de um experimento, o evento A ocorre nA vezes, ento a frequncia relativa de A nas N realizaes nA FA = N e a probalidade n P(A) = lim A N N Exemplo: Uma experincia que consiste em observar o sexo de um recm-nascido. Tal experincia j se realizou diversas vezes e existem registros do seu resultado. = {masculino, feminino} P(masculino)=0,52 e P(feminino)=0.48

Introduo
3 Conceito subjetivo
A probabilidade dada por um grau de crena ou de confiana que cada pessoa d a realizao de um evento. Exemplo: O ministro afirma que a inflao para o prximo ano ser de 3% com uma probabilidade de 90%.

Definio Formal de Probabilidade


Dado um experimento aleatrio E e um evento A do espao amostral . A probabilidade de A P(A) uma funo que associa um evento um nmero real, satisfazendo os seguintes axiomas:
1) P(A) 0 A 2) P() = 1 3) Sendo A e B dois eventos mutuamente exclusivos ou seja AB=, tem-se que P(AB) = P(A) + P(B)

Probabilidade de um evento Exemplo


Considere um experimento de seleo de cartas de um baralho. Cada carta tem a probabilidade 1/52. A: a carta selecionada um AS P(A) = 1/52+1/52+1/52+1/52=4/52

Principais Teoremas
1. Se o conjunto vazio ento P()=0 Demonstrao:
Seja A um evento qualquer. Considerando que A = temos que P(A )=P(A)+P() (Axioma 3). Como A =A ento, P(A) = P(A)+ P(). Logo P()=0.

Principais Teoremas
2. Se Ac o complemento do evento A, ento P(Ac) = 1- P(A). Demonstrao: Considere que =A Ac e A Ac = . Ento P(A Ac)=P(A)+P(Ac). Assim, P()= P(A Ac)= P(A)+P(Ac); 1=P(A)+P(Ac). P(Ac) = 1- P(A).

Exemplo Teorema 2
Exemplo: Um agente de compras declara que h uma probabilidade de 0,90 de que um fornecedor enviar uma carga livre de peas defeituosas. Usando o complemento podemos afirmar que h uma probabilidade de 1-0,90 = 0,10 de que a carga conter peas defeituosas.

Principais Teoremas
3. Se A B, ento P(A) P(B)
Demonstrao Considere B= A (Ac B). Ora A e Ac B so mutuamente exclusivos. Logo, P(B) = P(A)+P(Ac B). P(Ac B) = P(B)- P(A). Como P(B)- P(A) 0 por axioma 1. P(A) P(B).

Exemplo Teorema 3
Exemplo: Jogar um dado e observar o resultado. ={1,2,3,4,5,6}. Sejam os eventos A={a face potencia de 2} B={a face par}. Ento, A={2,4} e B={2,4,6} e P(A)=2/6 e P(B)=3/6

Principais Teoremas
4. Teorema da Soma (Lei da Adio) util quando temos dois eventos e estamos interessados em conhecer a probabilidade de pelo menos um deles ocorra. Dados dois eventos A e B, estamos interessados em conhecer a probabilidade de que o evento A ou evento B ocorra, ou ambos ocorram: P(AB)=P(A)+P(B)-P(AB) Demonstrao: a) Se A e B so mutuamente exclusivos
P(AB) = 0. Recai-se axioma 3

Principais Teoremas

b) Se AB . A e (Ac B) so mutuamente exclusivos . Pelo Axioma 2, P(A Ac B)=P(A B)= P(A)+P(Ac B) (i); . Considerando que B a unio dos eventos mutuamente exclusivos (B A) e (B Ac). Logo P(B)= P(B A) +P(B Ac); P(B Ac)= P(B)P(B A) (ii). Substituindo (ii) em (i), P(AB)=P(A)+P(B)-P(AB)

Exemplo Teorema 4
Considere uma fbrica com 50 empregados. Um empregado no tem xito em satisfazer os padres de desempenho, se completa o trabalho mais tarde e/ou monta produtos com defeito. Foi observado que 5 dos 50 tinham completado o trabalho mais tarde, 6 dos 50 trabalhadores tinham montado peas defeituosas e 2 dos 50 tinham tando completado mais tarde como montado produtos defeituosos.

Principais Teoremas
A o evento que o trabalho termina mais tarde B o evento que o produto montado defeituoso.
P(A) = 5/50 = 0,10 P(B) = 6/50 = 0,12 P(AB)= 2/50=0,04 P(A B) = P(A) + P(B) - P(AB)= 0,10+0,12-0,04= 0,18

A B significa a probabilidade de um trabalhador terminar mais tarde ou montar produtos defeituosos.

Probabilidades dos Espaos Amostrais


Seja ={a1,...,an}. Considera-se cada evento formado por um resultado simples A={ai}. Cada evento simples {ai} associa-se um nmero pi denominado probabilidade de {ai} satisfazendo as seguintes condies:
A) pi 0 i=1,2,...,n B) p1 + p2 +....+pn =1

Exemplo
Trs cavalos A, B e C, esto em uma corrida; A: tem duas vezes mais probabilidades de ganhar que B, e B tem duas vezes mais probabilidade de ganhar que C. Quais so as probabilidades de vitria de cada um, isto , P(A), P(B) e P(C)?

Soluo
Considerando P(C)=p ento P(B)=2p e P(A)=2 P(B)=4p. Como a soma das probabilidades 1, ento:
p+2p+4p=1 ou 7p= 1 ou p=1/7

Logo temos, P(A)=4/7; P(B)=2/7 e P(C)=1/7.

Espaos Amostrais Finitos Equiprovveis


Quando se associa a cada ponto amostral a mesma probabilidade, o espao amostral chama-se equiprovvel ou iniforme. Se contm n pontos, ento a probabilidade de cada ponto ser 1/n Se um evento A contm r pontos, ento:

1 P( A) = r n
Este mtodo de avaliar P(A) enunciado da seguinte maneira.

n o de vezes em que o evento A pode ocorrer P( A) = o n de vezes em que o espao amostral ocorre

ou
n o de casos favorveis a A P( A) = n o total de casos de

Exemplo
Escolha aleatoriamente (indica que o espao equiprovvel) uma carta de um baralho com 52 cartas. Sejam A: a carta de ouros e Calcular P(A)
n o de ouros 13 1 = = P(A) = o n de cartas 52 4

Problema de Contagem
Combinao de r elementos tomados (combinados) p a p. Calcula-se por:
r r! = = p p!(r p )!

Cr , p

Exemplo
Num lote de 12 peas, 4 peas so defeituosas; duas peas so retiradas aleatoriamente. Calcule a) A probabilidade de ambas serem defeituosas. Seja A=ambas so defeituosas.
A pode ocorrer pode ocorrer Logo,
P( A) =
4 =6 2 12 = 66 2

6 1 = 66 11

Exemplo
b) A probabilidade de ambas no serem defeituosas. Seja B=ambas no serem defeituosas. 8
B pode ocorrer pode ocorrer
= 28 2 12 = 66 2

Logo, P( B) = 28 = 14
66

33

Exemplo
c) A probabilidade de ao menos uma ser defeituosa.Seja C=ao menos uma defeituosa. C o complemento de B, C = Bc
Logo,
14 19 P (C ) = 1 = 33 33

Probabilidade Condicional
Seja E: lanar um dado, e o evento A={sair o nmero 3}. Ento P(A) = 1/6. Considere o evento B={sair um nmero impar}. P(A/B) =1/3 Definio: Dado dois eventos A e B, denota-se
NCF ( A B) P( A B) NCF ( A B ) NTC P( A / B) = = = NCF ( B ) P( B) NCF ( B) NTC

Exemplo: Lanamento de dois dados


1 2 3 4 5 6 1 (1,1) (2,1) (3,1) (4,1) (5,1) (6,1) 2 (1,2) (2,2) (3,2) (4,2) (5,2) (6,2) 3 (1,3) (2,3) (3,3) (4,3) (5,3) (6,3) 4 (1,4) (2,4) (3,4) (4,4) (5,4) (6,4) 5 (1,5) (2,5) (3,5) (4,5) (5,5) (6,5) 6 (1,6) (2,6) (3,6) (4,6) (5,6) (6,6)

Exemplo 1
A={(x1,x2)/x1 + x2 = 10}, B={={(x1,x2)/x1 > x2} onde x1 o resultado do dado 1 e x2 o resultado do dado 2. Calcular P(A), P(B), P(A/B) e P(B/A)
NCF ( A) 3 1 = = P( A) = NCT 36 12
NCF ( A B) 1 P( A / B) = = NCF ( B ) 15

NCF ( B) 15 5 = = P( B) = NCT 36 12
NCF ( A B) 1 = P( A / B) = 3 NCF ( A)

Exemplo 2
Considere a situao promocional de oficiais dos Estados Unidos.
Status de Promoo dos Oficiais de Polcia Homens Mulheres Promovidos No Promovidos Total 288 672 960 36 204 240 Total 324 876 1200

Exemplo 2
H- evento em que um oficial seja um homen M evento em que um oficial seja uma mulher A evento em que um oficial promovido Ac evento em que um oficial no promovido

Tabela de Probabilidade Associada Homens Mulheres Promovidos No Promovidos Total 0,24 0,56 0,80 0,03 0,17 0,20 Total 0,27 0,73 1

P(HA)= 288/1200 =0,24 P(HAc)= 672/1200 =0,56 P(MA)= 36/1200 =0,03

P(MAc)= 204/1200 =0,1

Exemplo 2
Qual a probabilidade P(A/H)?
288 288 / 1200 0,24 P(A / H ) = = = = 0,30 960 960 / 1200 0,80 P(A / H ) = 288 P(A H) 0,24 = = = 0,30 960 P(H ) 0,80

Teorema do Produto
A probabilidade de ocorrncia simultnea de dois eventos, A e B, do mesmo espao amostral, igual ao produto da probabilidade de um deles pela probabilidade condicional do outro, dado o primeiro.
P(A/B)= P(B/A)= P(AB) P(B) P(AB) P(A)

P(A B) = P(B)P(A/B) P(A B) = P(A)P(B/A)

Exemplo 3
Em um lote de 12 peas, 4 so defeituosas, 2 peas so retiradas um aps a outra sem reposio. Qual a probabilidade de que ambas so sejam boas? A={a primeira boa}, B={a segunda boa}
8 7 14 P(A B) = P(A)P(B/A) = = 12 11 33

Independncia Estatstica
Um evento A considerado independente de um outro evento B se a probabilidade de A igual probabilidade condicional de A dado B, isto
P(A)=P(A/B) P(B)= P(B/A) P(AB)=P(A) P(B)

Exemplo 4
Sendo ={1,2,3,4} um espao amostral equiprovvel e A={1,2}; B={1,3}; C={1,4} trs eventos de S. Verificar se os eventos A, B e C so independentes. Soluo;
P(A)=1/2; P(B)=1/2; P(AB)=1/4; logo, P(A B)=1/2 1/2 =1/4. P(A)=1/2; P(C)=1/2; P(AC)=1/4; logo, P(A C)=1/2 1/2 =1/4. P(B)=1/2; P(C)=1/2; P(BC)=1/4; logo, P(B C)=1/2 1/2 =1/4. P(A)=1/2; P(B)=1/2; P(C)=1/2; P(A B C)=1/4.

Teorema de Bayes
Sejam A1,...,An um conjunto de eventos mutuamente disjuntos de um espao amostral , isto , =A1A2 ..., An. Seja B um evento de , ento para cada i
P( B / Ai ) P ( Ai ) P ( A1 B) P ( Ai / B) = = P( B) P ( B / A1 ) P ( A1 ) + ... + P ( B / An ) P ( An )

Exemplo 5
Considere uma empresa fabricante que recebe embarques de peas de dois diferentes fornecedores. A1 = evento em que uma pea do fornecedor 1 : P(A) = 0,65 A2 = evento em que uma pea do fornecedor 2: P(B) = 0,35 B = evento em que uma pea boa R = evento em que uma pea ruim P(B/A1) = 0,98, P(R/A1) = 0,02, P(B/A2) = 0,95 P(R/A2) = 0,05

Exemplo 5
Dado que uma pea ruim, qual a probabilidade da pea ser do fornecedor 1 e qual a probabilidade da pea ser do fornecedor 2? P(A1/R)=? e P(A2/R)=?

Exemplo 5
P(A1R)=P(A1)P(R/A1) P(R) = P(A1 R)+P(A2 R) = P(A1)P(R/A1) + P(A2)P(R/A2) P(A1R)=(0,65)(0,02)=0,0130 P(A2R)=(0,35)(0,05)=0,0175 P(R)= 0,0305 P(A1/R)= 0,013/0,0305

Exemplo 5
P(A2R)=P(A2)P(R/A2) P(A1R)=(0,65)(0,02)=0,0130 P(A2R)=(0,35)(0,05)=0,0175 P(R)= 0,0305 P(A2/R)= 0,0175/0,0305

Introduo
E: Lanamento de duas moedas = {(c,c), (c,k), (k,k), (k,c)}. X: nmero de caras obtidas nas duas moedas R={0,1,2} X=0 corresponde ao evento (c,c) com prob. 1/4 X=1 corresponde aos eventos (k,c) e (c,k) com prob. 2/4 X=2 corresponde ao evento (k,k) com prob. 1/4

Definio
Sejam E um experimento e o espao associado ao experimento. Uma funo X, que associe a cada elemento um nmero real X() denominada varivel aleatria.
X X()

Uma varivel aleatria pode ser contnua ou discreta.

Classificao de Variveis
Discreta
Se o nmero de valores possveis de X (seu contradomnio) for finito ou infinito enumervel.

Contnua
Se o contradomnio um intervalo ou um conjunto de intervalos.

Exemplos de Varivel Aleatria Discreta


Experimento Varivel Aleatria X Valores da Varivel Aleatria

Contratar Clientes Inspecionar um embarque de 50 rdios


Vender um automvel Vendas no Shopping

Nmero de clientes que compram Nmero de rdios defeituosos


Gnero do cliente Nmero de clientes

0,1,2,3,4,5 0,1,2,3,4,5,...,49,50
0 se masculino 1 se feminino 0,1,2,3,4,5........

Exemplos de Varivel Aleatria Contnua


Experimento Operar um banco Encher um recipiente de refrigerante Trabalhar em um projeto Varivel Aleatria X Tempo entre as chegadas dos clientes Nmero de ml Valores da varivel Aleatria x0 0 x 343

Porcentagem do trmino do projeto aps 6meses

0 x 100

Funo de Probabilidades ou Distribuio de Probabilidade


Seja X uma varivel aleatria discreta. A probabilidade de X assumir um valor x uma funo que se representa P(X=x) ou P(x). P(X=x) determina a distribuio de probabilidades da varivel aleatria X. Exemplo:
E:lanamento de duas moedas X: nmero de caras obtidas Tabela: Funo de Probabilidade x
P(X) 0 1/4 1 2/4 2 1/4

Funo de Probabilidades
Representao Grfica
f(x)
1 1/2 1/4 0 1 2

1 2 P ( x) = , 4 x
x

x = 0,1,2

Funo de uma varivel aleatria


Qualquer funo de uma varivel aleatria tambm uma varivel aleatria. Se X uma V.A., ento Y=(x) tambm uma V.A. Exemplo:
E:lanamento de dois dados X: pontos de um dado Y=X1+X2 soma dos pontos de dois

lanamentos Z=max{(X1,,X2)} onde Xi varivel aleatria associada ao resultado do i-simo dado

Exemplo
Tabela: Funo de Probabilidade de X
x P(X) 1 1/6 2 1/6 3 1/6 4 1/6 5 1/6 6 1/6

Tabela: Funo de Probabilidade de Y


y 2 3 4 5 6 7 8 9 10 11 12

P(Y) 1/36 2/36

3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/3

Exemplo
Tabela: Funo de Probabilidade de Z
z P(Z) 1 1/36 2 3/36 3 5/36 4 7/36 5 9/36 6 11/36

Funo de Distribuio (Repartio)


Seja X uma V. A. discreta. A funo de distribuio da varivel X, no ponto x, definida como sendo a probabilidade de que X assuma um valor menor ou igual a x. F(x)=P(X x) Exemplo: Lanamento de duas moedas. F(x) = 0 se x < 0 f(x) F(x) = se 0 x < 1 1 F(x) = se 1 x < 2 1/2 1/4 F(x) = 1 se x 2
2

Funo de Distribuio Propriedades


1. F ( x) = xxP( xi ) 2. F(- )=0, F( )=1 3. P(a < X b)=F(b)-F(a) 4. P(a X b)=F(b)-F(a)+P(X=a) 5. P(a < X < b)=F(b)-F(a)-P(X=b) 6. F(x) uma funo no decrescente, isto , F(b) > F(a), para b>a
i

Funo de Densidade de Probabilidade


Relembrando: Em uma varivel aleatria contnua o conjunto dos possveis valores pode ser um intervalo ou um conjunto de intervalos. Seja X uma varivel aleatria continua. A funo de densidade de probabilidade f(x) uma funo que satisfaz as seguintes condies: 1. f(x) > 0 para todo x Rx 2. R f ( x) = 1 Para qualquer a < b em Rx
x

P (a < X < b) = a f ( x)dx


b

Observaes

1. A probabilidade de qualquer ponto zero 2. P(a X b)=P(a X <b)=P(a < X b= P(a < X <b). 3. A funo integrada entre dois limites a e b (a < b) a probabilidade, ou seja, a rea sob curva. 4. A funo de distribuio definida como:
F ( x) = f ( x)dx
x

Exemplo
Seja X uma varivel aleatria contnua com a f(x) seguinte funo de densidade. 2
2 x para 0 < x < 1 f ( x) = 0 caso contrrio
1 1 1 2

f(x) uma funo de densidade.


+ 0 1

1 0 f ( x) = 0dx + 2 xdx + 0dx = x 2 = 1 0 0 1

P(1/4 < x < 3/4)?


3 / 4 3 2 1 2 P(1 / 4 < x < 3 / 4) = 2dx = x 2 = = 1/ 2 1/ 4 4 4 1/ 4
3/ 4

Exemplo
Funo de distribuio F(x) Para x< 0 Para 0 x < 1 F ( x) = 0 xdx + 0x2 xdx = x 2 0 1 x F ( x) = xdx + 0 2 xdx + 1 0dx = 1 Para x 1
F ( x) = xdx = 0
x

Varivel Aleatria Bidimensional


Usa-se quando h interesse por dois resultados simultneos. Por exemplo, altura H e peso P duas pessoas. Definio:
Sejam E um experimento aleatrio e o espao amostral associado a E. Sejam X=X() e Y=Y(), duas funes, cada uma associando um nmero real a cada resultado , denomina-se o par (X,Y) uma varivel aleatria bidimensional.

Grfico
X()

Y()

Distribuio conjunta de duas varivel aleatrias DISCRETAS


Seja (X,Y) uma varivel aleatria bidimensional discreta. Funo de probabilidade: Trata-se de uma funo associada um nmero p(xi,yj) representado por P(X= xi, Y=yj) satisfazendo as seguintes condies:
p(xi,yj) > 0
p( xi , y j ) = 1
j =1 i =1

Exemplo: Sejam E=jogar dois dados e (X,Y) pontos dos respectivos dados

Funo de densidade de probabilidade conjunta de duas variveis CONTNUAS


Seja (X,Y) uma varivel aleatria bidimensional discreta. Diz-se que f(x,y) uma funo de densidade de probabilidade conjunta se : 1. f(x,y) 0 2. f ( x, y)dxdy = 1

Funo de Distribuio Conjunta


Definio:
F(x,y)=P(X x,Y y)

Caso (X,Y) DISCRETA, tem-se


F(x,y) = p(xi,yj) tal que x xi e y yj

Caso (X,Y) CONTNUA, tem-se


F ( x, y ) = f ( x, y )dxdy
x y

Distribuio de Probabilidade Marginal: Caso (X,Y) DISCRETA


Dado uma varivel aleatria bidimensional (X,Y) e sua distribuio conjunta. Pode-se determinar a distribuio de X sem considerar Y: Distribuio Marginal de X (sem considerar Y)
P(X=xi) = P(X=xi, - < y < ) ou P(X=xi)=j P(xi,yj)

Distribuio Marginal de Y (sem considerar X)


P(Y=yj) = P( - < x < , Y=yj) ou P(Y=yj)=i P(xi,yj)

Distribuio de Probabilidade Marginal: Caso (X,Y) CONTNUA


Funo de densidade marginal de X
g ( x) = f ( x, y )dy

Funo de densidade marginal de Y


h( y ) = f ( x, y )dx

Variveis Aleatrias Independentes


Caso DISCRETA:Seja (X,Y) uma varivel aleatria discreta bidimensional. Diz-se que X e Y so independentes se e somente se p(xi,yj) = p(xi) p(yj) para quaisquer i e j. Caso CONTNUA:Seja (X,Y) uma varivel aleatria discreta bidimensional. Seja g(x) a funo de densidade de X e h(x) a de Y. Diz-se que X e Y so independentes se e somente se f(x,y) = g(x) h(y) para todo

Exemplo
0 0 0,10 1 0,04 2 0,06 p(xi) 0,20 1 0,20 0,08 0,12 0,40 2 0,20 0,08 0,12 0,40 p(yj) 0,50 0,20 0,30 1,00

Verificar se X e Y so independentes. Soluo: para todo para i e j; i=j=0, 1, 2 deve-se ter p(xi,yj)=p(xi) p(yj)

Exemplo
Suponha que (X,Y) tenha a seguinte funo de densidade
x + y 0 < x < 1, 0 < y < 1 f ( x, y ) = 0 caso contrrio

Faa a distribuio marginal de x Faa a distribuio marginal de y X e Y so independentes

Medidas de Posio: Mdia ou Esperana Matemtica

Uma seguradora paga R$ 30.000,00 em caso de acidente de carro e cobra uma taxa de R$ 1.000,00. Sabe-se que a probabilidade de que um carro sofra um acidente 3%. Quanto espera a seguradora ganhar por cada carro segurado?

Soluo: Suponhamos que entre 100 carros, 97 do lucro de R$ 1.000,00 e 3 do prejuzo de R$ 29.000,00. Lucro total: 97 1.000 - 3 29.000=10.000,00 Lucro mdio por carro = 10.000,00/100= R$ 100,00 Se chamamos X: lucro por carro e E(X) por lucro mdio por carro, teremos

Medidas de Posio: Mdia ou Esperana Matemtica


E( X ) = 97 1.000,00 3 29.000,00 100 97 3 = 1.000,00 29.000,00 100 100 = 0,97 1.000,00 - 0,03 29.000,00
n

Definio para o caso discreto E ( X ) = xi p ( xi )


i =1

Definio para o caso contnuo E ( X ) = f ( x)dx

um nmero real e tambm uma mdia ponderada. Notao: ou x.

Exemplo: Caso Discreto


Suponha que um nmero seja selecionado entre 1 e 10. Seja X o nmero de divisores do nmero selecionado. Calcular o nmero mdio de divisores do nmero selecionado. No No de Divisores
1 2 3 4 5 6 7 8 9 1 2 2 3 2 4 2 4 3
X 1 2 3 4 Total P(x) 1/10 4/10 2/10 3/10 1 X P(X) 1/10 8/10 6/10 12/10 2,7

E(X)=2,7

Exemplo: Caso Contnuo


Seja X uma varivel aleatria contnua com a seguinte funo de densidade.
2 x para 0 < x < 1 f ( x) = 0 caso contrrio

A esperana de X
x3 1 E ( X ) = 2 xxdx = 2 x 2 dx = 2 = 2/3 3 0 0 0
1 1

Medidas de Posio: Propriedades da Mdia


Sejam X e Y duas variveis aleatrias e k uma constante.
1. E(k)=k, k sendo uma constante. 2. E(KX)=kE(X). 3. E(XY)= E(X) E(Y). 4. E(Xk)= E(X) k. 5. E(X-)=E(X)- =0 6. E(XY)=E(X) E(Y) se X e Y so independentes.

Medidas de Posio: Mediana


A mediana de uma varivel aleatria o valor que divide a distribuio em duas partes iguais, ou seja F(Md)=0,5 onde Md a mediana. Exemplos
Seja X uma v. a. contnua com a seguinte funo de distribuio F(x)=0 para x < 0 F(x)=x2 para 0 x < 1 F(x)=1 para x1 Logo a mediana ser o valor x tal que F(x=md)=0,5. A mediana 1 / 2

Medidas de Posio: Moda


o valor da varivel com maior probabilidade, se X discreta, ou maior densidade se X for contnua. Exemplos:
Se X discreta tal que
X -1 0 2 P(X) 0,3 0,2 0,5

A moda m0 =2. Se X contnua tal que f(x) = 2x para 0 x 1 A moda m0 1 e a mediana F(md)=0,5
Md

2 x 2 Md 2 2 xdx = 0,5 2 0 = Md = 0,5 0

Medidas de Disperso: Varincia


Define-se a varincia de uma varivel aleatria como sendo
Var ( X ) = = E[( X X ) ]
2 X 2

Para X discreta

2 = ( X i ( X ) ) 2 P( xi ) X

Para X contnua 2 = ( x X ) 2 f ( x)dx X

Medidas de Disperso: Desvio Padro


O desvio padro a raiz quadrada da varincia
X = 2 X

Pode-se encontrar o desvio usando a varincia dada por


= E ( X ) ( X )
2 X 2 2

Medidas de Disperso: Propriedades da Varincia


1. Seja k uma constante. A varincia de uma constante zero. Var(k)=0. 2. Var(kX)=k2Var(X). 3. Var(Xk)=Var(X)

Exemplo
Seja X discreta tal que A esperana de X
3 i =1

X P(X)

-1 0,3

0 0,2

2 0,5

( X ) = xi p( xi ) = 1 0,3 + 0 0,2 + 2 0,5 = 0,7

A varincia de X
3 i =1

Var ( X ) = ( xi ( x)) 2 p( xi ) = (1,7) 2 0,3 + (0,7) 2 0,2 + (1,3) 2 0,5 = 1.8

O desvio padro
X = 1,041 = 1,020

Exemplo
Seja X uma varivel aleatria contnua com a seguinte funo de densidade.
2 x para 0 < x < 1 f ( x) = 0 caso contrrio

A esperana de X 2/3. A varincia de X


1 0

Var ( X ) = ( x 2 / 3) 2 2 xdx = 1 / 18

O desvio padro
X = 1 / 18 = 0 , 235

Distribuio de Bernoulli
Uma lmpada escolhida ao acaso Ensaio de Bernoulli A lmpada defeituosa (sucesso)

X = 0 se a lmpada no defeituosa X = 1 se a lmpada defeituosa P(X=1)= 3/5 P(X=0)= 2/5

Nmero de ensaios = 1

Distribuio de Bernoulli
Seja X uma v. com dois resultados possveis: fracasso e sucesso. X x1 =1 sucesso; P(X=1)=p X x1 =0 fracasso; P(X=0)=1-p=q Mdia: X = p Varincia 2 = pq

Distribuio Binomial
3 Ensaios de Bernoulli, n = 3 P(defeituosa)= p =3/7 P(no defeituosa)=1-p= 4/7 Seja X o nmero de defeituosas 1. 2. 3. 4. O experimento consiste de trs ensaios idnticos; Dois resultados so possveis; As probabilidades p e (1-p) so as mesmas em cada ensaio; Os ensaios so independentes.

Distribuio Binomial
P(defeituosa)= p =3/7 P(no defeituosa)= (1-p)= 4/7 Seja X o nmero de defeituosas S= { 111, 110, 101, 011, 001, 010, 100, 000} X = 0 - {000} X = 1 {001, 010, 100} X = 2 - {110, 101, 011} X = 3 - {111} P(001) = 4/7 4/7 3/7= 48/343 P(010) = 4/7 3/7 4/7=48/343 P(100) = 3/7 4/7 4/7=48/343

P(X=1) = P(001) + P(010) + P(10

Distribuio Binomial
Seja X o nmero de defeituosas

P(X=1) = P(001) + P(010) + P(100) P(X=1) = 3 48/343

3 1 2 P ( X = 1) = (3 / 7 ) (4 / 7 ) 1

Distribuio Binomial
Funo de Probabilidade

onde p(x) = a probabilidade de x sucessos em n ensaios n = o nmero de ensaios


p = probabilidade de um sucesso em um ensaio (1-p) = probabildidade de um fracasso em um ensaio

n x n x P ( X = x) = ( p ) (1 p ) x

X B(n,p)

Distribuio Binomial
Seja X uma v.a. Binomial com parmetros n e p onde p a probabilidade de sucesso. X {0,1,2,..n} Mdia: X = np Varincia 2 = npq

Exemplo

Considere uma loja de roupas que receba 3 clientes p = o cliente faz compra = 0,30 X- nmero de clientes (1-p) = o cliente no faz compra = 0,70 que compram x p(x) 0 1 2 3
Total

0,343 0,441 0,189 0,027


1,00

3! (0,30) 0 (0,70) 3 0!3! 3! (0,30)1 (0,70) 2 1!2! 3! (0,30) 2 (0,70)1 2!1! 3! (0,30) 3 (0,70) 0 3!0!

Exemplo: Representao Grfica


P(x) 0.50 0,40 0,30 0,20 0,10 0 1 2 3 x

Funo de Probabilidade

Exemplo: Caractersticas
Valor Esperado E(X) = = np Varincia Var(X) = 2 = np(1-p)

Considerando o exemplo, temos E(X) = = 3 0,30 = 0,90 Var(X) = 2 = np(1-p)= 3 0,30 0,70 = 0,63

Distribuio Multinomial
uma extenso da binomial para mais de dois resultados possveis. Seja um experimento que permite ter k resultados diferentes (A1,...Ak) formando o espao amostral. Considere n tentativas deste experimento, sendo que os pi i=1,..,k associados aos k resultados permanecem constantes durante as repeties do k experimento, com pi = 1 i =1 Sejam Xi,..Xk v. as. que so os nmeros de ocorrncias associados aos k resultados possveis com

Distribuio Multinomial
Funo de Probabilidade
n! n n P ( X = n1, ..., X k = nk ) = p1n1 p2 2 .... pk k n1!... nk !

Com nk = n i =1 Mdia: E(Xi)= n pi Varincia: Var(Xi) = n pi qi

Exemplo
Um dado lanado 10 vezes. Qual a probabilidade de terem aparecido duas vezes o no 2, duas vezes o no 5, trs vezes o no 1 e uma vez os demais resultados? n=10 p1= p2= p3 = p5 = p6 = 1/6 X1=3, X2=2, X3=1,X4=1,X5=2,X6=1
P( X 1 = 3, X 2 = 2, X 3 = 1, X 4 = 1, X 5 = 2, X 6 = 1) =
3 2 1 1 2 1

10! 1 1 1 1 1 1 = = 0,002 3!2!1!1!2!1! 6 6 6 6 6 6

Exemplo
E(Xi)=nipi e Var(Xi) = n pi qi E(X1)= 10 1/6 =5/3 e Var(X1) = 10 1/6 5/6=50/36 E(X2)= 10 1/6 =5/3 e Var(X2) =10 1/6 5/6=50/36 E(X3)= 10 1/6 =5/3 e Var(X3) = 10 1/6 5/6=50/36 E(X4)= 10 1/6 =5/3 e Var(X4) = 10 1/6 5/6=50/36 E(X5)= 10 1/6 =5/3 e Var(X5) = 10 1/6 5/6=50/36

Distribuio de Poisson
Carros que passam por um cruzamento por minuto, durante uma certa hora do dia. Erros tipogrficos por pgina,em um material impresso. Defeitos por unidade (m2,m, etc) por pea fabricada Mortes por ataque de corao por ano, numa cidade. Problemas de filas de espera

Distribuio de Poisson
Representa a distribuio de probabilidade de uma varivel aleatria que registra o nmero de ocorrncias sobre um intervalo de tempo ou espao especficos.

Propriedades do experimento Poisson:


A probabilidade de uma ocorrncia a mesma para quaisquer dois intervalos de tempo. A ocorrncia ou no ocorrncia em qualquer intervalo independente da ocorrncia ou no-ocorrncia em qualquer intervalo

Funo de Probabilidade de Poisson


x e P( x) = x!
0,,1,2,3, P(x) = a probabilidade de x ocorrncias em um intervalo = valor esperado ou nmero mdio de ocorrncias em um intervalo e = 2,71828 X P()

Uma varivel aleatria de Poisson no tem limites. x =

Mdia: E(X) = Varincia: Var(X)=

Exemplo
Suponha que observado o nmero de chegadas a uma caixa automtica de um banco durante um perodo de 15 minutos. A probabilidade de um carro chegar a mesma para quaisquer dois perodos de tempo de igual cumprimento. A chegada ou no chegada de um carro em qualquer perodo de tempo independente da chegada ou no chegada de um outro carro em qualquer outro perodo de tempo.

Exemplo
Suponha que o nmero mdio de carros que chegam no perodo de 15 minutos 10, ento

x e 10 x e = P( x) = x! x!
X- nmero de carros que chegam em qualquer perodo de 15 minutos A probabilidade de 5 chegadas em 15 minutos
105 e 10 = 0,0378 P ( X = 5) == 5!

E(X) = 10 e Var(X) = 10

Distribuio Uniforme
Seja X uma varivel aleatria que representa o tempo de vo de uma aeronave viajando de Chicago at Nova York. Suponha que o tempo de vo pode ser qualquer valor no intervalo de 120 at 140 minutos. Suponha que os intervalos de um minuto so equiprovveis. Parmetro da distribuio: um intervalo

Distribuio Uniforme
X uma v.a. uniformemente distribuda se a sua funo de densidade for dada por
f ( x) = 0 se x < a ou x > b 1 f ( x) = se a x b ba

A funo de distribuio F(x) dada por:


xa 1 F ( x) = dx = ba a ba
x

Logo

F ( x) = 0 se x a xa F ( x) = se a < x < b ba F (x) = 1 se x b

Exemplo: X U[3,7]

0.255

f(x)

0.250

0.245 3 4 5 6 7

Distribuio Exponencial
muito til para descrever o tempo que se leva para completar uma tarefa. Ex: O tempo para carregar um caminho considerando que em mdia gasta-se 15 minutos para realizar esta tarefa. Outras situaes tpicas: tempo de chegadas a um lava-jato, tempo de vida de aparelhos, tempo de espera em restaurantes, caixas de banco, etc Parmetro: mdia (ex: tempo mdio) ou valor esperado.

Distribuio Exponencial
X tem uma distribuda exponencial se sua funo de densidade dada por
f ( x) = 0 se x < 0 f ( x) = e x se x 0

A funo de distribuio dada por


F ( x) = e x dx = (1 e x )
0

Logo

F ( x) = 0 se x 0 F ( x) = 1 e x se x > 0

E(X)=1/ VAR(X)=1/2

Exemplo: X Exp[1]
1.0
f(x)

0.5

0.0 0 1 2 3 4 5 6 7 8 9

Distribuio Normal
Tem sido usada em uma ampla variedade de aplicaes prticas nas quais as variveis aleatrias so: alturas e pesos de pessoas, medies, ndices , etc. Parmetros: mdia e desvio padro. Ex: Os salrios dos diretores das empresas em So Paulo, distribuem-se normalmente com mdia de R$ 20.000,00 e desvio padro de R$ 500,00.

Distribuio Normal
X tem uma distribuda normal se sua funo de 1 x densidade dada por 1 2
2

f ( x) =

, - < x <

Principais caractersticas
O ponto mximo de f(x) o ponto X=. Os pontos de inflexo da funo so: X= + e X= . A curva simtrica com relao a . E(X)= e VAR(X)= 2

Se X N(, 2) ento a varivel aleatria


Z= X

N(0,1)

Exemplo: Z N(0,1)
99,72%

Normal Padro
0.4

95,44% 68,26%

f(x)
0.3 0.2 0.1 0.0 -3 -2 -1 0 1 2 3

Exemplo: X N(3,16)
0.10

f(x)
0.05

0.00 -10 0 10 20

3-4

3+4

Probabilidades
0.10

f(x)
0.05

P(-1 X 3 )= P(3 X 7 )

0.00 -10 0 10 20

3-4

3 3+4

Probabilidades
0.4

f(x)
0.3 0.2 0.1 0.0 -3 -2 -1 0 1 2 3

P(-1 Z 0 )= P(0 Z 1)

Z1 =

X1

Z2 =

X2

P(x1 X x2 )= P(z1 Z z2)

Tcnicas de Estatstica Descritiva

tcnicas para extrair informaes de conjuntos de dad

35 1729 28 24 3328 22 30 18 18 23 22 17 28 2821 22 42 2918 73 22 36 33


nmero de funcionrios

Distribuio das idades dos funcionrios 14 12 10 8 6 4 2 0

Conceitos de Estatstica
Conceitos Antigos
a) simples contagem aritmtica Exs: estatstica de asfaltos, mais de 2000 acidentes em seis meses no Estado do Rio de Janeiro. O Estado do Cear tem 679 indstrias A populao do Brasil no ano de 2000 de 169.799.170. b) Sinnimo de dados publicados oficialmente Publicaes tais como: Anurio Estatstico do Brasil, Revista Brasileira de Estatstica, IBGE, Boletim Estatstico.

Conceitos de Estatstica
Exs: O anurio Estatstico do Brasil revelou mais de trs mil milionrios no Braisl. Segundo as estatsticas realizadas pela Organizao Mundial de Sade, ultimamente divulgada, as doenas cardacas constituem a primeira causa de bitos. c) Simples transformao numricas (percentagens, mdias e razes, etc.) Exs: S 35 em 1000 alunos do curso primrio concluem o Secundrio. 58% dos veculos que rodam no pas so nacionais.

Conceitos Antigos

Conceitos de Estatstica
d) Construo de tabelas e grficos
Nmero de Pessoas por Regio e Sexo

Conceitos Antigos

Sexo Masc. Fem. Total

Norte 5.44 5.52 10.96

Nordete 7.80 9.02 16.82

Fonte: DataSus

Tabelas Estatsticas
As tabelas devem obedecer Resoluo n0 886, de 26 de outrubro de 1966, do Conselho Nacional de Estatstica.

Cabealho, Corpo e Rodap


O Cabealho deve conter o suficiente pra que sejam respondidas as seguintes perguntas

Tabelas Estatsticas Vendas no 1 bimestre de 1996 da


0

ABC Veculos
Perodo Unidades Vendidas 20 10 30

Corpo: Contm os registros dos dados

Janeiro/1996 Fevereiro/1996 Total


Fonte: ABC Veculos

O que refere o fato? Vendas Onde? ABC Veculos Quando? no 10 bimestre de 1996

Rodap: Fonte dos dados

Sries Estatsticas
qualquer tabela que apresenta a distribuio de um conjunto de dados estatsticos em funo da POCA LOCAL OU ESPCIE

1. Srie Temporal ou Cronolgica

Identifica-se pelo carter varivel do fator cronolgico. O local e a espcie (fenmeno) so elementos fixos..
Vendas no 10 bimestre de 1996 da ABC Veculos, por ms
Perodo Unidades Vendidas 20 10 30

Janeiro/1996 Fevereiro/1996 Total

2. Srie Geogrfica ou Histrica

Apresenta como elemento varivel o fator geogrfico. A poca e o fato (espcie) so elementos fixos. Tambm chamada de espacial, territorial ou de localizao.
Vendas no 10 bimestre de 1996 da ABC Veculos, por filial
Filiais So Paulo Rio de Janeiro Total Unidades Vendidas 13 17 30
Fonte: ABC Veculos

3. Srie Especfica
O carter varivel apenas o fato ou espcie. Tambm chamada de srie categrica.
Vendas segundo a marca, no 10 bimestre de 1996 da ABC Veculos
Marca FIAT GM Total
Fonte: ABC Veculos

Unidades Vendidas 18 12 30

4. Distribuio de Freqncias
a srie em que os dados so agrupados com suas respectivas freqncias. 0
Vendas no 1 bimestre de 1996 da ABC Veculos
Nmero de Carros por dia 100 200 Total
Fonte: ABC Veculos

Nmero de de dias 42 18 60

200 300

Populao e Amostra
Populao: grande conjunto de dados que tem as caractersticas de interesse.
Em muitas situaes no possvel acessar todas a populao. Em geral as razes econmicas so as mais determinantes.

Amostra um subconjunto da populao

Estatisitica descritiva Populao

Amostra

Inferncia Estatstica
Estimao de quantidades Extrapolao dos resultados Testes de Hipteses

Populao e Amostra

A seleo da amostra pode ser feita e diversas maneiras dependentes entre outros fatores, do grau de conhecimento que temos da populao e de recursos disponveis. A idia que amostra tenta fornecer um subconjuto de valores o mais parecido possvel com a populao que lhe d origem. A amostragem mais usada a casual simples, em que selecionamos ao acaso, com ou sem reposio, os itens da populao que faro parte da amostra.

Levantamento por Amostragem


POPULAO: moradores de uma metrpole AMOSTRA: uma parte dos moradores

Exemplos de Tipo de Amostragem


1. Amostragem Aleatria Um professor deseja oferecer prmios (5 livros) a seus alunos em nmero de 35 e resolve apelar para o sorteio. 2 . Amostragem Estratificada A turma tem 13 alunos e 22 alunas.
5 1 = 35 7 1 de 13 = 1,86 2 alunos 1 de 22 = 3,14 3 alunas 7 7

A amostra

Exemplos de Tipo de Amostragem


3. Amostragem Sistemtica Sorteia-se apens um nmero aleatoriamente entre 1 a 35 e depois de 7 em 7 somando sempre 7 ao nmero econtrado. Suponha que o primeiro nmero 14 ento, O segundo 14+7=21 O terceiro 21+7 = 28 O quarto 35 O quinto 7 Por que de 7 em 7 ? 5 1 = um em cada 7 o intervalo da amostra

Tipos de Dados
O trabalho estatstico exige um conjunto de dados resultante de uma coleta de informaes extradas da populao. Exemplos: Suponha que um questionrio foi aplicado aos alunos do primeiro ano da escola.
Id: nmero de identificao do aluno Turma: turma em que foi alocado (A ou B) Sexo: F se feminino, M se masculino Idade: idade em anos Altura: altura metros Peso: peso em quilograma Classe social: baixa, mdia ou alta Cada Caracterstica chamada de varivel

Varivel

Caracterstica que pode ser observada (ou mensurada) nos elementos da populao, devendo ter um e apenas um resultado para cada elemento observado.

Classificao de variveis
Nominal Qualitativa Varivel Quantitativa Ordinal Discreta Contnua

Variveis
Qualitativas - O resultado da varivel um atributo ou uma qualidade. Exemplos: tipo de unidade de I/O, tipo de microprocessador, grau de instruo do usurio do sistema, etc. Quantitativas - O resultado um nmero numa escala pr-determinada. Exemplos: quantidade de mquinas ligadas, nmero de transaes por segundo, tempo de resposta, etc.

Variveis Qualitativas
Ordinais - Representam atributos de qualidades com uma ordenao natural Exemplos:
Classe social: A alta, M mdia, C baixa Escolaridade: 1 Primrio 2 Secundrio 3 Superior

No Ordinais (Nominais) - Representam atributos de qualidades sem uma ordenao natural Exemplos:
Sexo: F- feminino M masculino Turma na escola: A ou B Cor: amarelo, branco, verde e azul Hbito de fumar: Sim ou no

Variveis Quantitativas
Discretas - Os resultados possveis formam uma lista finita (geralmente, nmeros inteiros).
Exemplo: quantidade de mquinas ligadas.

Contnuas - Teoricamente, existem infinitos resultados possveis (um intervalo dos nmeros rea
Exemplo: tempo de resposta (em segundos).

Histogramas
Representao grfica de uma distribuio de freqncias por meio de retngulos justapostos O mtodo mais til para descrever resultados obtidos com respeito a uma varivel , sem sombra de dvida, a distribuio de freqncia.
f 8 7 6 5 4 3 2 1 0 122 127 132 137 142 147 152 157 162 167 172 177 182 187 192

Distribuio de Freqncias
poucos intervalos: os grupos se tornam muito abrangentes, impedindo uma maior preciso; muitos intervalos: risco de no realar os aspectos relevantes; def. da amplitude dos intervalos

Polgono de Freqncias Acumuladas


f. acum.

37,5% das pessoas medidas tem menos de 1,47 m 37,5% de 40 = 15 facum(x) = 15; x=?
f 8 7 6 5 4 3 2 1 0

45 40 35 30 25 20 15 10 5 0
12 2 12 7 13 2 13 7 14 2 14 7 15 2 15 7 16 2 16 7 17 2 17 7 18 2 18 7 19 2

f. acum.

Fig.: Polgono de Freqncias Acumulada

12 2 12 7 13 2 13 7 14 2 14 7 15 2 15 7 16 2 16 7 17 2 17 7 18 2 18 7 19 2

Fig.: Polgono de Freqncia

Exemplo usando varivel qualitativa ordinal

Grau de instruo do chefe da casa, numa amostra de 40 fam lias do Conj. Resid. Monte Verde, Florianpolis, SC, 1988.
Cdigos: 1 - nenhum grau de instruo completo 2 - primeiro grau completo e 3 - segundo grau completo Resultados observados em cada famlia 3 3 2 2 3 1 3 3 3 2 2 1 2 2 3 2 3 3 3 3 3 3 3 2 2 3 1 3 2 3 3 2 3 1 1 1 3 3 3 3

Distribuio de Freqncias do Grau de Instruo do chefe da casa


Grau de Instruo Nenhum grau Primeiro grau Segundo grau Total
Frequncia Absoluta

Frequncia Relativa (em %

6 11 23 40

15,0 27,5 57,5 100,0

Grfico de Barras
Grau de Instruo do Chefe da Casa
segundo grau primeiro grau nenhum
0 4 8 12 16 20 24

nmero de famlias

Grfico em colunas
Grau de instruo do chefe da casa 25 nmero de famlias 20 15 10 5 0 nenhum primeiro grau segundo grau

Grfico de Setor
Grau de Instruo do chefe da casa
nenhum (15,0 %)
Total 360 Parte x

segundo grau (57,5 %)

primeiro grau (27,5 %)

Exemplo usando varivel quantitativa Discreta

Numa rede de computadores, a quantidade de mquinas que costumam estar ligadas, por dia 20 26 21 21 20 21 23 22 24 22 22 22 23 23 23 22 23 22 24 21

Distribuio de Freqncias
Mquinas Freqncia em uso (absoluta) 20 2 21 4 22 6 23 5 24 2 25 0 26 1 Total 20 Freqncia (relativa) 0,10 (10%) 0,20 (20%) 0,30 (30%) 0,25 (25%) 0,10 (10%) 0 0,05 ( 5%) 1 (100%)

Grfico de Hastes
Freq.
6 4 2

20

21

22

23

24

25

26

Mquinas em uso

Exemplo usando varivel quantitativa Contnua


Tempo (em segundos) para carga de um aplicativo num sistema compartilhado (50 observaes):

5,2 5,5 8,9 8,2 5,7 4,9 6,5

6,4 6,2 7,3 7,1 6,2 5,0 5,9

5,7 4,9 5,4 4,9 4,9 5,7

8,3 5,7 4,8 5,0 5,1 6,3

7,0 5,4 4,8 9,1 6,3 5,1 8,4 6,2 5,6 6,8 5,0 6,7 8,2 9,9 5,4 5,6 6,0 4,7 18,1 5,3 6,0 6,8 7,3 6,9

Primeiro passo: Determinar a amplitude

5,2 5,5 8,9 8,2 5,7 4,9 6,5

6,4 6,2 7,3 7,1 6,2 5,0 5,9


4,7

5,7 4,9 5,4 4,9 4,9 5,7

8,3 5,7 4,8 5,0 5,1 6,3

7,0 5,4 4,8 9,1 6,3 5,1 8,4 6,2 5,6 6,8 5,0 6,7 8,2 9,9 5,4 5,6 6,0 4,7 18,1 5,3 6,0 6,8 7,3 6,9

Amplitude 18,1-4,7 = 13,4

18,1

Segundo passo: Determinar a amplitude Estimativa do nmero de intervalos

poucos intervalos: os grupos se tornam muito abrangentes, impedindo k = n = 50 = 7,07 = 7 uma maior explicao do comportamento; Estimativa da amplitude muitos intervalos: risco de no realar os aspectos de intervalos relevantes;

range h= = 13 , 4 / 7 = 1,914 = 1,92 k

Distribuio de Freqncias
Mquinas Freqncia em uso (absoluta) 4.70 |-- 6.62 34 6.62 |-- 8.54 12 8.54 |-- 10.46 3 10.46 |-- 12.38 0 12.38 |-- 14.30 0 14.30 |-- 16.22 0 16.22 |-- 18.14 1 50 Freqncia (relativa) 0,68 (68%) 0,24 (24%) 0,06 (6%) 0 (0%) 0 (0%) 0 (0%) 0,02 ( 2%) 1 (100%)

Histograma do tempo (em segundos) para carga de um aplicativo num sistema compartilhado (50 observaes

40 35 30 Frequencia 25 20 15 10 5 0 5,66 7,58 9,5 11,42 tempo (seg) 13,34 15,26 17,18

Diagramas de Disperso
Um diagrama de disperso serve para saber se existe alguma correlao (forte, fraca, moderada, positiva, negativa, etc.) entre duas variveis.

Grfico de Curvas
Usados em processos para se acompanhar a evoluo de uma varivel em relao a um ou mais limites existentes
Turbidez no Rio Capivari

Turbidez (UNT)

100 80 60 40 20 0
29 /5 12 /4 20 /2 28 /8 16 /1 0 5/ 12 4/ 1 5/ 7

Turbidez antes da bacia Turbidez depois da bacia Limite legislao

Dia/95

Fig.: Grfico de Controle

Consideraes
Dados Qualitativos melhor visualizao com grfico de barras, colunas ou circulares (tipo torta); Variveis Discretas (tipo nmero de filhos por comum que utilizemos medidas casal) intervalares para melhor codific-las grfico de hastes (com enumerao natural) com freqncias ou freqncias acumuladas; Variveis contnuas grficos em forma de histograma e polgonos de freqncia.

Consideraes
Muitas vezes precisamos relacionar as variveis em estudo: diagramas de disperso so aconselhveis; Grficos setoriais, particularmente teis para visualizar diferenas entre classes. No acomodam grandes quantidades de categorias
reagrupar as menos importantes em um grupo chamado outros ou, utilizar um grfico de barras, sendo que estas devem vir separadas;

O uso de polgonos de freqncia induz o leitor a aceitar a continuidade da varivel apresentada.

Consideraes
Os grficos tipo torta (setor) permitem uma visualizao das partes em funo do todo. Servem para enfatizar a importncia de um setor (grupo, produto, etc.) frente a outros As sries cronolgicas podem ser representadas por grficos de: colunas, curvas e barras. As sries especficas e geogrficas podem ser representadas por grficos de: colunas, barras e setor.

Medidas
Depois que voc conheceu os conceitos de coleta de dados, variao, causas comuns e causas especiais, chegou a hora de estudarmos algumas formas de medir os resultados. Para melhor interpretar os resultados obtidos com uma amostra, so definidas algumas medidas:
medidas de posio central medidas de posio medidas de disperso.

Medidas de Tendncia Central


Mostram a tendncia dos pontos se concentrarem em torno de um determinado valor

Medidas de Tendncia Central


H vrias medidas de tendncia central. Entre elas citamos a mdia aritmtica, a mediana, a mdia harmnica, geomtrica, etc. Cada uma dessas medidas apresenta vantagens e desvantagens, e a escolha depende dos objetivos desejados.

Mdia Aritmtica
A mdia aritmtica, ou simplesmente mdia, de um conjunto de n valores x1, ..., xn definida como: x1 + ... + xn 1 n X= = xi n n i =1 As letras gregas so usadas para representar parmetros populacionais e as letras comuns parmetros amostrais. A mdia de uma amostra representada por X e mdia de uma populao representada pela letra grega . Exemplo: A mdia aritmtica de 7,5 7,9 8,1 8,2 8,7
X= 7,5 + 7,9 + 8,1 + 8,2 + 8,7 = 8,08

Mdia Aritmtica para Dados Agrupados


calculada quando a informao disponvel o valor mdio do intervalo i (Xi) e a freqncia do intervalo i (fi):
K

f1 X 1 +....+ f K X K i=1 X= = K f1 +....+ f K fi


i =1

fi X i

Exemplo
Considere os seguintes dados
12,58 14,47 15,17 15,83 16,67 12,97 14,51 15,23 15,98 16,83 13,45 14,53 15,29 16,01 16,97 13,53 14,58 15,37 16,11 17,05 13,59 14,65 15,40 16,17 17,13 13,61 14,78 15,45 16,23 17,22 13,62 14,83 15,51 16,35 17,3 13,78 14,97 15,62 16,43 17,48 13,97 15,06 15,67 16,49 17,8 14,21 15,13 15,73 16,52 18,47

Intervalos de classe

Freqncia absoluta

12,51 a 13,50 13,51 a 14,50 14,51 a 15,50 15,51 a 16,50 16,51 a 17,50 17,51 a 18,50

3 8 15 13 9 2

X=

3(13) + 8(14) + 15(15) + 13(16) + 9(17) + 2(18)

= 15,46

Mdia Aritmtica Ponderada


Algumas vezes associa-se a cada observao um peso Wi. onde esse peso representa a importncia atribuda a cada observao. Nesse caso a mdia ponderada calculada n como: wi xi w1x1 + .... + wn xn i =1 X= = n w1 + .... + wn wi
i=1

Exemplo: O exame de seleo pode ser composto de trs provas onde as duas primeiras tem peso 1 e a terceira tem peso 2. Um candidato com notas 70 75 e 90 ter mdia final:
1(70) + 1(75) + 2(90) X= = 81,25 4

Mediana
Dado um conjunto de valores em ordem crescente, a mediana definida como:
Se n impar, o valor central; Se n par, a mdia simples dos dois valores centrais. Exemplos Exemplo 1: Na amostra 25 26 26 28 30 a mediana

~ = 26 x
Exemplo 2: Na amostra 71 73 74 75 77 79 a mediana

~ = (74 + 75) = 74,5 x 2

Mediana: dados agrupados


Intervalos de classe Freqncia absoluta Freqncia acumulada

12,51 a 13,50 13,51 a 14,50 14,51 a 15,50 15,51 a 16,50 16,51 a 17,50 17,51 a 18,50 1. Calcula-se n/2

3 8 15 13 9 2 50/2=25

3 11 26 39 48 50

2. Identifica-se a classe da mediana 3. Utiliza-se a frmula


n f h 2 Md = l Md + f md

terceira classe
14,51 11 0,99

lMd - limite inferior da classe M f - soma das freqncias anteriores a classe da mediana h amplitude da classe da mediana

Moda
A moda o valor que ocorre com maior freqncia, ou seja, o valor mais comum.
Exemplos Exemplo 1: A amostra 23 25 25 26 26 26 27 29 tem moda 26. Exemplo 2: A amostra 71 73 73 75 76 77 77 79 81 tem moda 73 e 77. A moda pode ser mltipla ou pode no existir.

Moda: Dados agrupados


Considere os seguintes dados
12,58 14,47 15,17 15,83 16,67 12,97 14,51 15,23 15,98 16,83 13,45 14,53 15,29 16,01 16,97 13,53 14,58 15,37 16,11 17,05 13,59 14,65 15,40 16,17 17,13 13,61 14,78 15,45 16,23 17,22 13,62 14,83 15,51 16,35 17,3 13,78 14,97 15,62 16,43 17,48 13,97 15,06 15,67 16,49 17,8 14,21 15,13 15,73 16,52 18,47

Intervalos de classe

Freqncia absoluta

12,51 a 13,50 13,51 a 14,50 14,51 a 15,50 15,51 a 16,50 16,51 a 17,50 17,51 a 18,50
Mo = l + 1 h

3 8 15 13 9 2

l- limite inferior da classe Modal 14,51 1 diferena entre a freqncia da class modal e a freqncia anterior = 7 2 diferena entre a freqncia da class modal e a freqncia posterior = 2 h amplitude da classe modal =0,99

Relaes Empricas entre Mdia, Moda e Mediana


Para distribuies simtricas a mdia, a mediana e a moda coincidem aproximadamente. Para distribuies assimtricas observa-se o seguinte:

Relaes Empricas entre Mdia, Moda e Mediana


Exemplo A relao entre mdia e mediana para as amostras a seguir
A B C Distribuio simtrica Distribuio assimtrica direita Distribuio assimtrica esquerda 10 12 14 16 18 10 12 14 16 23 05 12 14 16 18
x = 14 = ~ = 14 x x = 15 > ~ = 14 x x = 13 < ~ = 14 x

Comparao entre Mdia, Moda e Mediana


Quo freqente?
Mdia: mais familiar Mediana: usada comumente Moda: usada s vezes

Existncia
Mdia: existe sempre. Mediana: existe sempre. Moda: pode no existir; pode haver mais de uma moda

Afetada pelos extremos?


Mdia: sim Mediana: no

Comparao entre Mdia, Moda e Mediana


Vantagens e desvantagens:
Mdia: funciona bem com muitos mtodos estatsticos Mediana: costuma ser uma boa escolha se h alguns valores extremos. Moda: apropriada para dados ao nvel nominal

Mdia Geomtrica (G)


a raiz de ordem n do produto dos valores da amostra:

G = n X 1X2 .... X n

Exemplo A mdia geomtrica de 12 14 16 :


G = 3 12 14 16 = 13,90

usada em administrao e economia para achar taxas mdias de variao, de crescimento,

Mdia Harmnica (H)


o inverso da mdia aritmtica dos inversos das observaes. n 1
H= 1 1 n Xi = 1 Xi
H=

Exemplo A mdia harmnica de 12 14 16 :

3 = 13 1 1 1 + + 12 14 16

Relao entre Mdia Aritmtica, Geomtrica e Harmnica:


A mdia geomtrica e a mdia harmnica so menores, ou no mximo igual, mdia aritmtica. A igualdade s ocorre no caso em que todos os valores da amostra so idnticos. Quanto maior a variabilidade, maior ser a diferena entre as mdias harmnica e geomtrica e a mdia aritmtica.

HG X

Exemplo: Para a amostra 12 14 16 tem-se H = 13,81 < G = 13,90 < X = 14,00

Comparao Mdia Aritmtica e Mdia Harmnica

O grfico abaixo mostra uma simulao comparativa entre a Mdi Harmnica e a Mdia Aritmtica, calculadas para cinco avalia onde as notas de quatro avaliaes correspondem a 6,0 e a nota da avaliao varia de 0 a 10.

Medidas de Disperso
Invariavelmente as observaes individuais iro apresentar alguma disperso em torno do valor mdio. Isso chamado de variabilidade ou disperso dos dados. H muitas medidas de variabilidade, como por exemplo, a amplitude total, o desvio padro, a amplitude inter-quartlica ou o coeficiente de variao. Os valores mnimos e mximos tambm podem ser usados como medidas de variabilidade

Amplitude total
definida como a diferena entre o maior e o menor valor das observaes. Exemplo : 8,5 8,7 8,9 10,1 10,5 10,7 11,5 11,9 A amplitude total: R = 11,9 - 8,5 = 3,4 A amplitude fcil de calcular e fornece uma idia da magnitude da faixa de variao dos dados. No informa a respeito da disperso dos valores que caem entre os dois extremos.

Desvio Padro
Para uma amostra de n observaes, x1, ..., xn , o desvio padro S definido como: ( xi x )2
S= n 1

A vantagem do desvio padro que trata-se de uma medida de variabilidade que leva em conta toda a informao contida na amostra. O desvio-padro de uma populao representado por e o desvio padro de uma amostra por S.

Medidas de Disperso

As medidas mais utilizadas para representar a disperso a VARINCIA e o DESVIO PADRO. Uma dificuldade que a varincia no expressa nas mesmas unidades dos dados originais.

Desvio Padro
Exemplo: para a amostra 10 12 14 16 18 A mdia x = 14 e o desvio-padro calculado: Os desvios de cada valor em relao mdia totalizam zero pois a mdia o valor central:
10 14 = 4 12 14 = 2 14 14 = 0 16 14 = +2 18 14 = +4

S=

(10 14)2 + (12 14)2 + (14 14)2 + (16 14)2 + (18 14)2

= 3,16

Desvio Padro: Dados agrupados


Considere os seguintes dados
12,58 14,47 15,17 15,83 16,67 12,97 14,51 15,23 15,98 16,83 13,45 14,53 15,29 16,01 16,97 13,53 14,58 15,37 16,11 17,05 13,59 14,65 15,40 16,17 17,13 13,61 14,78 15,45 16,23 17,22 13,62 14,83 15,51 16,35 17,3 13,78 14,97 15,62 16,43 17,48 13,97 15,06 15,67 16,49 17,8 14,21 15,13 15,73 16,52 18,47

Intervalos de classe

Freqncia absoluta

12,50 a 13,50 13,51 a 14,50 14,51 a 15,50 15,51 a 16,50 16,51 a 17,50 17,51 a 18,50

3 8 15 13 9 2

X = 15,46

Ponto mdio do interva

3(13 15.46) 2 + 8(14 15.46) 2 + 15(15) 2 + 13(16 15.46) 2 + 9(17 15.46) 2 + 2(18 15.46) S= 50

Varincia
A varincia S2 definida como o quadrado do desvio padro.
S2 =

(x i x )2
n 1

A varincia de uma populao representada pela letra grega 2. A varincia o quadrado do desvio padro, ou seja, 2 =3,16 2 = 9,98

Amplitude Inter-quartlica
definida como a amplitude do intervalo entre o primeiro e o terceiro quartis, ou seja:

Q = Q3 Q1

s vezes tambm usada a semi-amplitude interquartlica, que a metade da anterior. Trata-se de uma medida de variabilidade bastante robusta, que pouco afetada pela presena de dados atpicos. A amplitude inter-quartlica guarda a seguinte relao aproximada com o desvio padro: Q = (4/3) x desvio padro

Coeficiente de Variao
definido como o quociente entre o desvio padro e mdia e, em geral, expresso em percentual.

S CV = 100 X

O coeficiente de variao uma medida dimensional til para comparar resultados de amostras ou populae cujas unidades podem ser diferentes. Uma desvantagem do coeficiente de variao que e deixa de ser til quando a mdia prxima de zero.

Medidas de Posio: Quartis


Tanto a mdia como o desvio padro podem no ser medidas adequadas para representar dados, pois: So afetadas por valores extremos Apenas com estes dois valores no temos idia da simetria ou assimetria da distribuio dos dados Se um conjunto de dados organizado em ordem crescente, o valor central a mediana. Valores que dividem o conjunto em quatro partes iguais so representados por Q1, Q2, Q3 e denominam-se primeiro, segundo e terceiro quartis, respectivamente. Q1 separa os 25% inferiores dos 75% dos superiores. Q2 a mediana. Q3 separa os 75% inferiores dos 25% dos superiores. Resumo dos cinco nmeros: Q1, Q2, Q3 e os valores mnimo e mximo.

Relaes
1o quartil = 25o percentil Mediana = 5o decil =50o percentil 3o quartil = 75o percentil

Clculo do k simo percentil


Ordenar os dados do menor para o maior Calcular:
L=(k/100)n n=nmero de valores k=percentil desejado

Se L no inteiro: arredonde L para o prximo inteiro acima dele. Pk L-simo valor da lista ordenada.

Quartis: Exemplo
Exemplo: Para a amostra a seguir calcular o primeiro e terceiro quartis:
13,3 13,5 17,2 13,8 12,3 12,7 13,0 14,5 14,9 15,8 13,1 13,3 14,1
x(i) 12,3 12,7 13,0 13,1 13,3 13,3 13,5 13,8 14,1 14,5 14,9 17,2

i 1 2 3 4 5 6 7 8 9 10 11 13

Exemplo: Quartis
1o quartil = 25o percentil
L=(25/100)13=3,25 L=4 P25=Q1=13,1

3o quartil = 75o percentil


L=(75/100)13=9,25 L=10 P25=Q3 =14,5

Percentis: Dados agrupados


Pi
in 100 Pi = l Pi + f Pi f h

i {1,2,3,4,5,6,...,99,100} lPi - limite inferior da classe de Pi f - soma das freqncias anteriores a classe de Pi h amplitude da classe de Pi fPi freqncia da classe Pi

Percentis: Exemplo com dados agrupados


Intervalos de classe Freqncia absoluta Freqncia absoluta

12,51 a 13,50 13,51 a 14,50 14,51 a 15,50 15,51 a 16,50 16,51 a 17,50 17,51 a 18,50

3 8 15 13 9 2

0,06 0,22 0,52 0,78 0,96 100,00

1o quartil = 25o percentil


25 50 11 1,01 100 P25 = 14,51 + = 14,51 + 0,1 = 14,52 15

Varivel Reduzida ou Padronizada


XX Z= S
Ela mede a magnitude do desvio em relao mdia, em unidades do desvio padro. Z = 1,5 significa uma observao desviada 1,5 desvios padro para cima da mdia. A varivel reduzida muito til para comparar distribuies e detectar dados atpicos. Dados so considerados atpicos quando Z > 3.

Exemplo

O engenheiro est analisando as espessuras de peas fabricad em duas mquinas de corte. O operador mediu uma pea da mq. A com espessura de 90 mm e outra pea da mq. B com espessura de 100 mm. engenheiro deve considerar esses dados reais ou atpicos? A mq. A possui mdia 51mm e desvio-padro de 12mm.
Mq. A Z =
X X 90 51 = = 3,25 S 12

Como Z > 3 dado atpico

A mq. B possui mdia 72mm e desvio-padro de 16mm.


Mq. B
X X 100 72 = = 1,75 Z= 16 S

Como Z < 3 no dado atpico

Exemplo
Supondo que 51 fosse a mdia em uma prova de ingls, onde o desvio padro 12, para um candidato que obtivesse 90 acertos tem-se:

X X 90 51 Z= = = 3,25 12 S
Conclui-se que na prova de ingls este candidato est 3,25 desvios-padro acima da mdia.

Medidas de assimetria e curtose


As caractersticas mais importantes so o grau de deformao ou assimetria e o grau de achatamento ou afilamento da curva de freqncias ou do histograma, chamado curtose.

Assimetria: skewness
Coeficiente = 0 (Simtrica) Coeficiente > 0 (Assimetria positiva) Coeficiente < 0 (Assimetria negativa)

S1

Moda < Mediana < Mdia

Moda > Mediana> Mdi

Clculo da assimetria
Conhecido como primeiro coeficiente de assimetria de Pearson S: desvio padro amostral Mo: moda X : mdia Assimetria assume valores entre -1 e +1

X Mo Sk = S

Curtose: kurtosis
Coeficiente de curtose de Pearson

a4 = m4/s4, onde m4 = (X a4 = 3 (Mesocrtica) a4 > 3 (Leptocrtica) a4 < 3 (Platocrtica)

x )4/n

A distribuio normal tem curtose igual a 3

Aspectos Gerais
A estatstica descritiva tem por objetivo resumir ou descrever caractersticas importantes de dados populacionais ou amostrais conhecidos; A inferncia estatstica tem por objetivo fazer generalizaes sobre a populao em estudo, a partir dos dados amostrais

Estimativa pontual da mdia


Um estimador uma estatstica amostral (como a mdia amostral) utilizada para obter uma aproximao de um parmetro populacional. Uma estimativa pontual um valor (ou ponto) nico usado para aproximar um parmetro populacional. A mdia amostral a melhor estimativa pontual para a mdia populacional. No entanto, no devemos esperar que a estimativa pontual coincida com o verdadeiro valor de um parmetro.

Estimativa pontual da mdia da populao


x uma estimativa de .
Seja (x1,...,xn) uma amostra de uma varivel aleatria X.

1 n x = xi n i =1

Quo boa esta estimativa?

Um problema
A maioria cr que a temperatura mdia do corpo humano 98,6oF. Uma amostra de dados parece sugerir que a mdia 98,2oF. Sabemos que as amostras tendem a variar, de forma que talvez a verdadeira temperatura mdia seja 98,6oF e a mdia amostral 98,2oF seja resultado de uma flutuao aleatria. Veremos se a temperatura mdia do corpo humano ou no 98,6oF. Dados do problema: n=106, S = 0,62oF e
x = 98 , 20

Estimativa intervalar
(Grandes amostras)
A probabilidade de que uma estimativa pontual coincida com o verdadeiro valor de um parmetro populacional pequena. A estimativa intervalar complementa a estimao pontual. Procuramos um intervalo em torno da estimativa pontual, que acompanhado de uma medida de variabilidade, tenha uma alta probabilidade de conter o verdadeiro valor do parmetro.

Estimativa intervalar
(Grandes amostras)
Assim, um intervalo de confiana (estimativa intervalar) representa uma amplitude de valores que tem probabilidade de conter o verdadeiro valor da populao. Todo intervalo de confiana est associado a um grau de confiana. O grau de confiana (ou nvel de confiana) uma medida que representa a probabilidade do intervalo conter o parmetro populacional. Tal probabilidade chamada de 1- .

Estimativa intervalar
(Grandes amostras)
A construo do intervalo para baseada na distribuio amostral da mdia amostral e no grau de confiana (1- ). No necessrio que a suposio de normalidade para os dados seja adequada.

Estimativa intervalar: varincia conhecida


Usando o teorema central do limite a mdia amostral X uma varivel aleatria que tem distribuio normal com Mdia e Desvio padro

Transformando X em uma varivel aleatria (VA) normal padro temos: X Z= ~ N (0,1) / n As mdias amostrais apresentam uma chance relativamente pequena de estar em uma das caudas da distribuio normal.

. a probabilidade da mdia estar em uma das caudas.

Estimativa intervalar: varincia conhecida


-z/2 e z/2 so os valores crticos em cada cauda. Um valor crtico um nmero na fronteira em que o valor da estatstica amostral tem pouca chance de ocorrer.
Nvel de confiana
f(x) /2 -z/2 1-
0

/2 z/2

onde z/2 um valor tal que a rea curva normal padronizada sua direita /2

Estimativa intervalar: varincia conhecida


Com os valores crticos -z/2 e z/2 e n podemos definir os valores do intervalo de confiana para , tal que
X z / 2 = 1 P z / 2 / n

Assim
- z /2 X - z / 2 n o que equivale a:

X- z/2

n X + z / 2

Estimativa intervalar: varincia conhecida


A margem de erro E a diferena mxima provvel (com probabilidade 1- ) entre a mdia observada (a mdia amostral) e a verdadeira mdia (mdia populacional). O erro mximo pode ser obtido da seguinte maneira
E = z / 2 n

Estimativa intervalar: varincia desconhecida


Estima-se a varincia populacional 2 atravs da varincia amostral. (x i x )2 2
S = n 1

Usa-se S = S 2 para calcular o intervalo de confiana para (n > 30).


X- z/2 S n X + z / 2 S n

Resposta do problema
S 0,62 E=1,96 = 1,96 = 0,12 n 106

xE x+E 98,20 0,12 98,20 0,12 98,08 98,32

Como o intervalo acima no contm 98,6oF, parece muito pouco provvel que o valor correto de seja 98,6oF. Devemos rejeitar a hiptese comum de que a temperatura mdia do corpo 98,6oF

Exerccios
Registram-se os valores 0,27; 0,26; 0,27; 0,33; e 0,32 em segundos, obtidos em cinco medies do tempo de fabricao de certo produto. Seja = 0,03. Determine intervalos de confiana com nveis de 95% e 99%, para o tempo real mdio que se requer para fabricar o produto Um prefeito de certa cidade turstica deseja estimar a mdia de gastos para os turistas que visitam a cidade. Com este propsito, uma amostra aleatria de 120 turistas foi selecionada para a investigao e encontrou-se que a mdia foi igual a 800 u.m.(unidades de medidas) com desvio padro de 200 u.m.
Achar o intervalo de confiana, a 99% para a mdia de gastos dos turistas com a cidade. Qual deve ser o tamanho mnimo da amostra para que, ao nvel de confiana de 95%, o erro de estimao seja 20 u.m.

Um problema
Um fabricante de latas deseja diminuir a espessura das latas a fim de reduzir o custo delas. Usualmente a espessura de 0,0282 cm mas o fabricante est testando latas de 0,0278 cm. A carga axial de uma lata o peso mximo suportado por seus lados. Isto medido atravs de uma placa seus lados. importante temos uma carga axial suficientemente grande a fim de a lata no ceder quando se coloca a tampa.

As latas de alumnio podem ter menor espessura para reduzir o custo?

Testes de Hipteses para Grandes Amostras


1 e 2 conhecidos. Se so 1 e 2 desconhecidos use s1 e s2 (desvio padro amostral) no lugar de 1 e 2
H0: 1 - 2 0

Testes Unilaterais

Ha: 1 - 2 < 0 H0: 1 - 2 0 Ha: 1 - 2 > 0

Testes Bilateral

H0: 1 - 2 = 0 Ha: 1 - 2 0

H0: 1 - 2 0

Teste de hipteses (unilateral)

Ha: 1 - 2 < 0

2 2 1 2 X 1 X 2 = N 1 2 , + n1 n2 d

12
n1

22
n2

1 - 2 = 0

H0: 1 - 2 0

Teste de hipteses (unilateral)


z / 2

Ha: 1 - 2 < 0

12
n1

22
n2
(1- ) = 0,95

= 0,05

1 - 2 =0
Rejeitar H0 No rejeitar H0

H0: 1 - 2 0

Teste de hiptese unilateral

Ha: 1 - 2 < 0

Estatstica do teste

Convertendo X 1 X 2 para normal padro


(1- ) = 0,95

z=

( x1 x2 ) n1 +

12

n2

P(Zz)=0,05

= 0,05

-1,64 Rejeitar H0

0 No rejeitar H0

Rejeitar H0 se z =

( x1 x2 )

12

22

1,64

H0: 1 - 2 0

Teste de hipteses (unilateral)

Ha: 1 - 2 > 0

2 2 1 2 X 1 X 2 = N 1 2 , + n1 n2 d

12
n1

22
n2

1 - 2 =0

H0: 1 - 2 0

Teste de hipteses (unilateral)

Ha: 1 - 2 > 0

(1- ) = 0,95

= 005

1 - 2=0
No rejeitar H0 Rejeitar H0

z / 2

12
n1

22
n2

H0: 1 - 2 0

Teste de hipteses (unilateral)


ConvertendoX

Ha: 1 - 2 > 0

z=

( x1 x2 )

Estatstica do teste

para normal padro

12
n1

22
n2

(1- ) = 0,95

= 0,05

P(Zz)=0,05

0 No rejeitar H0

1,64 Rejeitar H0

Rejeitar H0 se z =

( x1 x2 )

12

22

1,64

H0: 1 - 2 = 0

Teste de hipteses (bilateral)


d

Ha: 1 - 2 0

2 2 1 2 X 1 X 2 = N 1 2 , + n1 n2

1 - 2 =0

H0: 1 - 2 = 0

Teste de hipteses (bilateral)


0,452
1- = 0,95

Ha: 1 - 2 0

/2 = 0,025

/2 = 0,0,25

1 - 2=0

z / 2

12
n1

22
n2

Rejeitar H0

No rejeitar H0

Rejeitar H0

H0: 1 - 2 = 0

Teste de hipteses (bilateral) Ha: 1 - 2


Convertendo X para normal padro
0,452

Estatstica do teste

z=

( x1 x2 ) n1 +

12

22
n2

1- = 0,95

P(Zz)=0,05

/2 = 0,025

/2 = 0,0,25

1,96

Rejeitar H0

0 No rejeitar H0

1,96

Rejeitar H0

Rejeitar H0 sez =

( x1 x2 )

12

22

1.96 ou z =

( x1 x2 )

1.96

Testes de Hipteses para Grandes Amostras


1 e 2 desconhecidos e desiguais. Estatstica do teste

z=

( x1 x2 ) s s + n1 n2
2 1 2 2

Usar a tabela t-Student e o nmero de graus de liberdade o menor dentre valor entre n1-1 ou n2 -1.

Teste de hipteses: procedimento geral

1. Identifique o parmetro de interesse no problema. Neste caso . 2. Formule a hiptese nula (H0) 3. Formule uma hiptese alternativa apropriada (Ha) 4. Defina o nvel de significncia 5. Estabelea a estatstica usando a distribuio normal quando as varincias populacionais so conhecid ou a distribuio t-Student quando as varincias so estimadas. 6. Estabelea a regio de rejeio usando o nvel de significncia 7. Coletar os dados amostrais e calcular a estatstica do teste 8. Decida se H0 deve ou no ser rejeitada e transponha esta concluso para o contexto do problema

Resposta do problema
H0: 1 - 2 0
Hipteses

Ha: 1 - 2 < 0

1 - carga axial mdia das latas com espessura 0,02 2 - carga axial mdia das latas com espessura 0,02 = 0,05

Nvel de significncia do teste Estatstica do teste Regio de rejeio

t=

( x1 x2 ) s1 s2 + n1 n2
2 2

-1,64 Rejeitar H

0 No rejeitar

Resposta do problema
Dados da amostra 1 (carga das lata com espessura 0,0278): x1 = 267,1 n1 = 175 s1 = 22,1 Dados da amostra 2 (carga das lata com espessura 0,0282):

x1 = 281,80 n1 = 175 s1 = 27,8


Estatstica do teste t =
( x1 x2 ) s1 s2 + n1 n2
2 2

(267,1 281,8) = = 5,48 22,1 27,8 + 175 175

Como t/2 = -1,64 (174 graus de liberdade) existe uma forte evidncia para apoiar a afirmao que as latas de 0,0278 cm tm carga axial mdia inferior das latas de 0,0282 cm

Introduo
Estudar a relao entre duas variveis quantitativas

Exemplos
Idade e altura das crianas Tempo de prtica de esportes e ritmo cardaco Tempo de estudo e nota na prova Taxa de desemprego e taxa de criminalidade Expectativa de vida e taxa de analfabetismo

Estudo da relao entre variveis


Investigar a presena ou ausncia de relao linear sob dois pontos de vista: a) Quantificando a fora dessa relao: correlao b) Explicitando a forma dessa relao: regresso Diagrama de disperso: representao grfica das duas variveis quantitativas

Exemplo 1: nota na prova e tempo de estudo


X : tempo de estudo (em horas) Y : nota na prova
Pares de observaes (Xi , Yi) Tempo Nota 3,0 4,5 7,0 6,5 2,0 3,7 1,5 4,0 12,0 9,3

Diagrama de disperso: forte associao positiva

Diagrama de disperso: forte associao negativa

Coeficiente de correlao linear


O coeficiente de correlao linear definido como:

Correlao Linear
Correlao entre duas variveis quando uma delas est, de alguma forma, relacionada coma a outra. Suposies para medir a correlao:
Dados emparelhados Pares de dados terem distribuio normal bivariada .

Correlao linear mede o grua de relacionamento linear entre os valores emparelhados x e y em uma amostra.

Propriedades do coeficiente de correlao linear


Propriedade: -1 r 1 Classificao da correlao: r = 1, correlao linear positiva e perfeita r = -1, correlao linear negativa e perfeita r = 0, inexistncia de correlao linear Os valores de r no varia se todos os valores de qualaquer uma das variveis so convertidos para uma escala diferente. O valor de r no afetado pela escolha de x e y. Permutando todos valores de x e y o valor de r permanece o mesmo.

Diagrama de disperso
Exemplo para r = 1

Diagrama de disperso
Exemplo para r = -1

Diagrama de disperso
Exemplo para 0 < r < 1

Diagrama de disperso
Exemplo para -1 < r < 0

Diagrama de disperso
Exemplo para r = 0

Diagrama de disperso
Correlao no linear

Exemplo 2: criminalidade e analfabetismo


Considere as duas variveis abaixo observadas em 50 estados norte-americanos. (vide dados) Y: taxa de criminalidade X: taxa de analfabetismo Na figura a seguir, temos o diagrama de disperso de X e Y e podemos notar que, conforme aumenta a taxa de analfabetismo, a taxa de criminalidade tende a aumentar. Nota-se tambm uma tendncia linear.

Obs. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

Estado Tanalf-70 Exvida-70 Tcrime-75 Obs. Estado Tanalf-70 Exvida-70 Tcrime-75 Alabama 2.1 69.05 15.1 26 Montana 0.6 70.56 5 Alaska 1.5 69.31 11.3 27 Nebraska 0.6 72.6 2.9 Arizona 1.8 70.55 7.8 28 Nevada 0.5 69.03 11.5 Arkansas 1.9 70.66 10.1 29 New-Hampshire 0.7 71.23 3.3 California 1.1 71.71 10.3 30 New-Jersey 1.1 70.93 5.2 Colorado 0.7 72.06 6.8 31 New-Mexico 2.2 70.32 9.7 Connecticut 1.1 72.48 3.1 32 New-York 1.4 70.55 10.9 Delaware 0.9 70.06 6.2 33 North-Carolina 1.8 69.21 11.1 Florida 1.3 70.66 10.7 34 North-Dakota 0.8 72.78 1.4 Georgia 2 68.54 13.9 35 Ohio 0.8 70.82 7.4 Hawaii 1.9 73.6 6.2 36 Oklahoma 1.1 71.42 6.4 Idaho 0.6 71.87 5.3 37 Oregon 0.6 72.13 4.2 Illinois 0.9 70.14 10.3 38 Pennsylvania 1 70.43 6.1 Indiana 0.7 70.88 7.1 39 Rhode-Island 1.3 71.9 2.4 Iowa 0.5 72.56 2.3 40 South-Carolina 2.3 67.96 11.6 Kansas 0.6 72.58 4.5 41 South-Dakota 0.5 72.08 1.7 Kentucky 1.6 70.1 10.6 42 Tennessee 1.7 70.11 11 Louisiana 2.8 68.76 13.2 43 Texas 2.2 70.9 12.2 Maine 0.7 70.39 2.7 44 Utah 0.6 72.9 4.5 Maryland 0.9 70.22 8.5 45 Vermont 0.6 71.64 5.5 Massachusetts 1.1 71.83 3.3 46 Virginia 1.4 70.08 9.5 Michigan 0.9 70.63 11.1 47 Washington 0.6 71.72 4.3 Minnesota 0.6 72.96 2.3 48 West-Virginia 1.4 69.48 6.7 Mississippi 2.4 68.09 12.5 49 Wisconsin 0.7 72.48 3 Missouri 0.8 70.69 9.3 50 Wyoming 0.6 70.29 6.9

Exemplo 2: diagrama de disperso

28

Exemplo 2: clculo da correlao


mdia de Y = 7,38 e SY = 3,692 mdia de X = 1,17 e SX = 0,609 somatrio de XiYi = 509,12 Clculo da correlao entre X e Y:

Exemplo 3: expectativa de vida e analfabetismo


Considere as duas variveis abaixo observadas em 50 estados norte-americanos. (vide dados) Y: expectativa de vida X: taxa de analfabetismo Na figura a seguir, temos o diagrama de disperso de X e Y e podemos notar que, conforme aumenta a taxa de analfabetismo, a expectativa de vida tende a diminuir. Nota-se tambm uma tendncia linear.

Obs. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25

Estado Tanalf-70 Exvida-70 Tcrime-75 Obs. Estado Tanalf-70 Exvida-70 Tcrime-75 Alabama 2.1 69.05 15.1 26 Montana 0.6 70.56 5 Alaska 1.5 69.31 11.3 27 Nebraska 0.6 72.6 2.9 Arizona 1.8 70.55 7.8 28 Nevada 0.5 69.03 11.5 Arkansas 1.9 70.66 10.1 29 New-Hampshire 0.7 71.23 3.3 California 1.1 71.71 10.3 30 New-Jersey 1.1 70.93 5.2 Colorado 0.7 72.06 6.8 31 New-Mexico 2.2 70.32 9.7 Connecticut 1.1 72.48 3.1 32 New-York 1.4 70.55 10.9 Delaware 0.9 70.06 6.2 33 North-Carolina 1.8 69.21 11.1 Florida 1.3 70.66 10.7 34 North-Dakota 0.8 72.78 1.4 Georgia 2 68.54 13.9 35 Ohio 0.8 70.82 7.4 Hawaii 1.9 73.6 6.2 36 Oklahoma 1.1 71.42 6.4 Idaho 0.6 71.87 5.3 37 Oregon 0.6 72.13 4.2 Illinois 0.9 70.14 10.3 38 Pennsylvania 1 70.43 6.1 Indiana 0.7 70.88 7.1 39 Rhode-Island 1.3 71.9 2.4 Iowa 0.5 72.56 2.3 40 South-Carolina 2.3 67.96 11.6 Kansas 0.6 72.58 4.5 41 South-Dakota 0.5 72.08 1.7 Kentucky 1.6 70.1 10.6 42 Tennessee 1.7 70.11 11 Louisiana 2.8 68.76 13.2 43 Texas 2.2 70.9 12.2 Maine 0.7 70.39 2.7 44 Utah 0.6 72.9 4.5 Maryland 0.9 70.22 8.5 45 Vermont 0.6 71.64 5.5 Massachusetts 1.1 71.83 3.3 46 Virginia 1.4 70.08 9.5 Michigan 0.9 70.63 11.1 47 Washington 0.6 71.72 4.3 Minnesota 0.6 72.96 2.3 48 West-Virginia 1.4 69.48 6.7 Mississippi 2.4 68.09 12.5 49 Wisconsin 0.7 72.48 3 Missouri 0.8 70.69 9.3 50 Wyoming 0.6 70.29 6.9

Exemplo 3: diagrama de disperso


11

28

Exemplo 3: clculo da correlao


mdia de Y = 70,88 e SY = 1,342 mdia de X = 1,17 e SX = 0,609 somatrio de XiYi = 4122,8 Clculo da correlao entre X e Y:

Exerccio: Calcular a correlao


Temperatura Consumo 16 290 31 374 38 393 39 425 37 406 36 370 36 365 22 320 10 269

Modelo de Regresso
Estima ou prev uma varivel aleatria como uma funo de outras variveis aleatrias
Y= f(X)
Y, varivel resposta, varivel dependente X, varivel preditores, variveis independentes

Equao de Regresso Linear

y = b0 + b1 x
b0 e b1: parmetros de regresso determinados a partir dos dados, {(x1, y1), ..., (xn, yn)}.

Regresso Linear
Suposies
Estamos investigando apenas relaes lineares. Para cada par (x,y) uma varivel com distribuio normal. Todas as distribuies de y tem a mesma varincia.

Significado dos parametros b0 e b1


yi = b0 + b1 xi

x=1

b0 : intercepto b1 : inclinao da reta

b0 x x+1

Interpretao de b1 Para cada aumento de uma unidade em X, temos um aumento de b unidades em Y.

Determinando os parmetros
yi = 0 + 1 xi
i i

yi = b0 + b1 xi
i

e =y y
y
y

Erro

Valor observado da varivel aleatria dependente Valor estimado da varivel aleatria dependente

Mtodo dos Minmos Quadrados


n i =1 n i =1

min SSE =

2 ei

( yi yi )

Minimizao da soma dos quadrados devido ao erro

Resduos

Os parmetros b0 e b1

b0 = y b1 x b1 = xi yi n x y x n(x)
2 i 2

Os parmetros b0 e b1
Onde xi = o valor da varivel independente para a i-sima observao yi = o valor da varivel dependente para a i-sima observao

x = a mdia da varivel independente y = a mdia da varivel independente


n = nmero de observaoes

Exemplo 4: dados amostrais


Temperatura Consumo 16 290 31 374 38 393 39 425 37 406 36 370 36 365 22 320 10 269

Coeficiente de correlao e a reta ajustada


A correlao entre X e Y r = 0,962. A reta ajustada para este exemplo :

Exerccio Qual o consumo previsto para uma temperatura de 25C?

You might also like