Professional Documents
Culture Documents
Se tomarmos um determinado slido, sabemos que a uma certa temperatura haver a passagem para o estado lquido: Experimento Determinstico. Quais as chances das vendas de uma empresa crescerem? Existem dois resultados possveis: as vendas crescem ou no crescem Experimento Aleatrio.
Experimento Aleatrio
Processo de observao cujo resultado no determinado. O que caracteriza um experimento aleatrio
- A possibilidade de repetio sob as mesmas condies - Os resultados no so determinados a priori - Existncia de regularidade quando o nmero de repeties grande.
a) Lanar uma moeda honesta. b) Lanamento de um dado. c) Lanamento de duas moedas. d) Retirada de uma carta de um baralho completo de 52 cartas. e) Determinao da vida til de um componente.
Os eventos do exemplo 2
A={(1,1),(2,2), (3,3), (4,4), (5,5), (6,6)} B={(4,6), (5,5),(6,4)} C={} D={} E={(1,2),(2,1), (2,4),(3,6),(4,2),(6,3)}
AB
__
Exemplo 3:
Lanam-se duas moedas. Sejam A: sada de faces iguais e B=sada de cara na primeira moeda. Determine
a) AB b) AB c) A , B d)A B e) A B f) A B g)A B h) B-A i) A-B
Resoluo do Exemplo 3
a) AB = {(c,c, (c,r), (r,r)} b) AB={(c,c)} d) A B = {(r, c)} e)A B = {(c, r), (r, c), (r, r)} f) A B = {(r, c)} g) A B = {(c, r), (r, c), (r, r)} h) B-A = {(c,r)} i) A-B={(r,r)} = {(c,c), (c,r), (r,r), (r,c)}. A= {(c,c), (r,r)} B= {(c,c), (c,r)}
A A = , ( A ) = A
g) Leis de Morgan (A B) c = A B (A B) c = A B
Dizemos que os eventos A1,...,An formam uma partio do espao amostral se:
a) A
n i
, i = 1 ,..., n
j
b) A i A c) U A
i =1 i
= ,i j
Permite contar o nmero de resultados quando n objetos esto para ser selecionados a partir de um conjunto de N objetos, SEM LEVAR EM CONTA A ORDEM DELES.
N N! C = = n n!( N n )!
N n
Exemplo 4
N=5 e n=2
b c a e d
= { {a,b}, {a,c}, {a,d}, {a,e} {b,c}, {b,d}, {b,e}, {c,d}, {c,e}, {d,e} }
5 2
5 5! C = = 2 2!(5 2)! = 10
Permite contar o nmero de resultados quando n objetos esto para ser selecionados a partir de um conjunto de N objetos, LEVANDO EM CONTA A ORDEM DELES.
N N! P = n! = n ( N n )!
N n
Exemplo 5
N=5 e n=2
b c a e d
= { {a,b}, {b,a} {a,c}, {c,a} {a,d}, {d,a}, {a,e}. {e,a} {b,c}, {c,b} {b,d}, {d,b}, {b,e},{e,b} {c,d}, {d,c}, {c,e}, {e,c} {d,e}, {e,d} }
5 P2
5 5! = 2! = 2 (5 2)! = 20
Introduo
1 - Conceito Clssico
Se uma experincia tem N resultados possveis e igualmente provveis e nA o nmero de resultados de um evento A ento a probabilidade de A n P( A ) = A N Exemplos:
Lanamento de um dado. Seja A o evento que registra a sada par.
P(A) =
1 2
1 P ( A) = 2
Introduo
2 Conceito Frequentista
Se em N realizaes de um experimento, o evento A ocorre nA vezes, ento a frequncia relativa de A nas N realizaes nA FA = N e a probalidade n P(A) = lim A N N Exemplo: Uma experincia que consiste em observar o sexo de um recm-nascido. Tal experincia j se realizou diversas vezes e existem registros do seu resultado. = {masculino, feminino} P(masculino)=0,52 e P(feminino)=0.48
Introduo
3 Conceito subjetivo
A probabilidade dada por um grau de crena ou de confiana que cada pessoa d a realizao de um evento. Exemplo: O ministro afirma que a inflao para o prximo ano ser de 3% com uma probabilidade de 90%.
Principais Teoremas
1. Se o conjunto vazio ento P()=0 Demonstrao:
Seja A um evento qualquer. Considerando que A = temos que P(A )=P(A)+P() (Axioma 3). Como A =A ento, P(A) = P(A)+ P(). Logo P()=0.
Principais Teoremas
2. Se Ac o complemento do evento A, ento P(Ac) = 1- P(A). Demonstrao: Considere que =A Ac e A Ac = . Ento P(A Ac)=P(A)+P(Ac). Assim, P()= P(A Ac)= P(A)+P(Ac); 1=P(A)+P(Ac). P(Ac) = 1- P(A).
Exemplo Teorema 2
Exemplo: Um agente de compras declara que h uma probabilidade de 0,90 de que um fornecedor enviar uma carga livre de peas defeituosas. Usando o complemento podemos afirmar que h uma probabilidade de 1-0,90 = 0,10 de que a carga conter peas defeituosas.
Principais Teoremas
3. Se A B, ento P(A) P(B)
Demonstrao Considere B= A (Ac B). Ora A e Ac B so mutuamente exclusivos. Logo, P(B) = P(A)+P(Ac B). P(Ac B) = P(B)- P(A). Como P(B)- P(A) 0 por axioma 1. P(A) P(B).
Exemplo Teorema 3
Exemplo: Jogar um dado e observar o resultado. ={1,2,3,4,5,6}. Sejam os eventos A={a face potencia de 2} B={a face par}. Ento, A={2,4} e B={2,4,6} e P(A)=2/6 e P(B)=3/6
Principais Teoremas
4. Teorema da Soma (Lei da Adio) util quando temos dois eventos e estamos interessados em conhecer a probabilidade de pelo menos um deles ocorra. Dados dois eventos A e B, estamos interessados em conhecer a probabilidade de que o evento A ou evento B ocorra, ou ambos ocorram: P(AB)=P(A)+P(B)-P(AB) Demonstrao: a) Se A e B so mutuamente exclusivos
P(AB) = 0. Recai-se axioma 3
Principais Teoremas
b) Se AB . A e (Ac B) so mutuamente exclusivos . Pelo Axioma 2, P(A Ac B)=P(A B)= P(A)+P(Ac B) (i); . Considerando que B a unio dos eventos mutuamente exclusivos (B A) e (B Ac). Logo P(B)= P(B A) +P(B Ac); P(B Ac)= P(B)P(B A) (ii). Substituindo (ii) em (i), P(AB)=P(A)+P(B)-P(AB)
Exemplo Teorema 4
Considere uma fbrica com 50 empregados. Um empregado no tem xito em satisfazer os padres de desempenho, se completa o trabalho mais tarde e/ou monta produtos com defeito. Foi observado que 5 dos 50 tinham completado o trabalho mais tarde, 6 dos 50 trabalhadores tinham montado peas defeituosas e 2 dos 50 tinham tando completado mais tarde como montado produtos defeituosos.
Principais Teoremas
A o evento que o trabalho termina mais tarde B o evento que o produto montado defeituoso.
P(A) = 5/50 = 0,10 P(B) = 6/50 = 0,12 P(AB)= 2/50=0,04 P(A B) = P(A) + P(B) - P(AB)= 0,10+0,12-0,04= 0,18
Exemplo
Trs cavalos A, B e C, esto em uma corrida; A: tem duas vezes mais probabilidades de ganhar que B, e B tem duas vezes mais probabilidade de ganhar que C. Quais so as probabilidades de vitria de cada um, isto , P(A), P(B) e P(C)?
Soluo
Considerando P(C)=p ento P(B)=2p e P(A)=2 P(B)=4p. Como a soma das probabilidades 1, ento:
p+2p+4p=1 ou 7p= 1 ou p=1/7
1 P( A) = r n
Este mtodo de avaliar P(A) enunciado da seguinte maneira.
n o de vezes em que o evento A pode ocorrer P( A) = o n de vezes em que o espao amostral ocorre
ou
n o de casos favorveis a A P( A) = n o total de casos de
Exemplo
Escolha aleatoriamente (indica que o espao equiprovvel) uma carta de um baralho com 52 cartas. Sejam A: a carta de ouros e Calcular P(A)
n o de ouros 13 1 = = P(A) = o n de cartas 52 4
Problema de Contagem
Combinao de r elementos tomados (combinados) p a p. Calcula-se por:
r r! = = p p!(r p )!
Cr , p
Exemplo
Num lote de 12 peas, 4 peas so defeituosas; duas peas so retiradas aleatoriamente. Calcule a) A probabilidade de ambas serem defeituosas. Seja A=ambas so defeituosas.
A pode ocorrer pode ocorrer Logo,
P( A) =
4 =6 2 12 = 66 2
6 1 = 66 11
Exemplo
b) A probabilidade de ambas no serem defeituosas. Seja B=ambas no serem defeituosas. 8
B pode ocorrer pode ocorrer
= 28 2 12 = 66 2
Logo, P( B) = 28 = 14
66
33
Exemplo
c) A probabilidade de ao menos uma ser defeituosa.Seja C=ao menos uma defeituosa. C o complemento de B, C = Bc
Logo,
14 19 P (C ) = 1 = 33 33
Probabilidade Condicional
Seja E: lanar um dado, e o evento A={sair o nmero 3}. Ento P(A) = 1/6. Considere o evento B={sair um nmero impar}. P(A/B) =1/3 Definio: Dado dois eventos A e B, denota-se
NCF ( A B) P( A B) NCF ( A B ) NTC P( A / B) = = = NCF ( B ) P( B) NCF ( B) NTC
Exemplo 1
A={(x1,x2)/x1 + x2 = 10}, B={={(x1,x2)/x1 > x2} onde x1 o resultado do dado 1 e x2 o resultado do dado 2. Calcular P(A), P(B), P(A/B) e P(B/A)
NCF ( A) 3 1 = = P( A) = NCT 36 12
NCF ( A B) 1 P( A / B) = = NCF ( B ) 15
NCF ( B) 15 5 = = P( B) = NCT 36 12
NCF ( A B) 1 = P( A / B) = 3 NCF ( A)
Exemplo 2
Considere a situao promocional de oficiais dos Estados Unidos.
Status de Promoo dos Oficiais de Polcia Homens Mulheres Promovidos No Promovidos Total 288 672 960 36 204 240 Total 324 876 1200
Exemplo 2
H- evento em que um oficial seja um homen M evento em que um oficial seja uma mulher A evento em que um oficial promovido Ac evento em que um oficial no promovido
Tabela de Probabilidade Associada Homens Mulheres Promovidos No Promovidos Total 0,24 0,56 0,80 0,03 0,17 0,20 Total 0,27 0,73 1
Exemplo 2
Qual a probabilidade P(A/H)?
288 288 / 1200 0,24 P(A / H ) = = = = 0,30 960 960 / 1200 0,80 P(A / H ) = 288 P(A H) 0,24 = = = 0,30 960 P(H ) 0,80
Teorema do Produto
A probabilidade de ocorrncia simultnea de dois eventos, A e B, do mesmo espao amostral, igual ao produto da probabilidade de um deles pela probabilidade condicional do outro, dado o primeiro.
P(A/B)= P(B/A)= P(AB) P(B) P(AB) P(A)
Exemplo 3
Em um lote de 12 peas, 4 so defeituosas, 2 peas so retiradas um aps a outra sem reposio. Qual a probabilidade de que ambas so sejam boas? A={a primeira boa}, B={a segunda boa}
8 7 14 P(A B) = P(A)P(B/A) = = 12 11 33
Independncia Estatstica
Um evento A considerado independente de um outro evento B se a probabilidade de A igual probabilidade condicional de A dado B, isto
P(A)=P(A/B) P(B)= P(B/A) P(AB)=P(A) P(B)
Exemplo 4
Sendo ={1,2,3,4} um espao amostral equiprovvel e A={1,2}; B={1,3}; C={1,4} trs eventos de S. Verificar se os eventos A, B e C so independentes. Soluo;
P(A)=1/2; P(B)=1/2; P(AB)=1/4; logo, P(A B)=1/2 1/2 =1/4. P(A)=1/2; P(C)=1/2; P(AC)=1/4; logo, P(A C)=1/2 1/2 =1/4. P(B)=1/2; P(C)=1/2; P(BC)=1/4; logo, P(B C)=1/2 1/2 =1/4. P(A)=1/2; P(B)=1/2; P(C)=1/2; P(A B C)=1/4.
Teorema de Bayes
Sejam A1,...,An um conjunto de eventos mutuamente disjuntos de um espao amostral , isto , =A1A2 ..., An. Seja B um evento de , ento para cada i
P( B / Ai ) P ( Ai ) P ( A1 B) P ( Ai / B) = = P( B) P ( B / A1 ) P ( A1 ) + ... + P ( B / An ) P ( An )
Exemplo 5
Considere uma empresa fabricante que recebe embarques de peas de dois diferentes fornecedores. A1 = evento em que uma pea do fornecedor 1 : P(A) = 0,65 A2 = evento em que uma pea do fornecedor 2: P(B) = 0,35 B = evento em que uma pea boa R = evento em que uma pea ruim P(B/A1) = 0,98, P(R/A1) = 0,02, P(B/A2) = 0,95 P(R/A2) = 0,05
Exemplo 5
Dado que uma pea ruim, qual a probabilidade da pea ser do fornecedor 1 e qual a probabilidade da pea ser do fornecedor 2? P(A1/R)=? e P(A2/R)=?
Exemplo 5
P(A1R)=P(A1)P(R/A1) P(R) = P(A1 R)+P(A2 R) = P(A1)P(R/A1) + P(A2)P(R/A2) P(A1R)=(0,65)(0,02)=0,0130 P(A2R)=(0,35)(0,05)=0,0175 P(R)= 0,0305 P(A1/R)= 0,013/0,0305
Exemplo 5
P(A2R)=P(A2)P(R/A2) P(A1R)=(0,65)(0,02)=0,0130 P(A2R)=(0,35)(0,05)=0,0175 P(R)= 0,0305 P(A2/R)= 0,0175/0,0305
Introduo
E: Lanamento de duas moedas = {(c,c), (c,k), (k,k), (k,c)}. X: nmero de caras obtidas nas duas moedas R={0,1,2} X=0 corresponde ao evento (c,c) com prob. 1/4 X=1 corresponde aos eventos (k,c) e (c,k) com prob. 2/4 X=2 corresponde ao evento (k,k) com prob. 1/4
Definio
Sejam E um experimento e o espao associado ao experimento. Uma funo X, que associe a cada elemento um nmero real X() denominada varivel aleatria.
X X()
Classificao de Variveis
Discreta
Se o nmero de valores possveis de X (seu contradomnio) for finito ou infinito enumervel.
Contnua
Se o contradomnio um intervalo ou um conjunto de intervalos.
0,1,2,3,4,5 0,1,2,3,4,5,...,49,50
0 se masculino 1 se feminino 0,1,2,3,4,5........
0 x 100
Funo de Probabilidades
Representao Grfica
f(x)
1 1/2 1/4 0 1 2
1 2 P ( x) = , 4 x
x
x = 0,1,2
Exemplo
Tabela: Funo de Probabilidade de X
x P(X) 1 1/6 2 1/6 3 1/6 4 1/6 5 1/6 6 1/6
Exemplo
Tabela: Funo de Probabilidade de Z
z P(Z) 1 1/36 2 3/36 3 5/36 4 7/36 5 9/36 6 11/36
Observaes
1. A probabilidade de qualquer ponto zero 2. P(a X b)=P(a X <b)=P(a < X b= P(a < X <b). 3. A funo integrada entre dois limites a e b (a < b) a probabilidade, ou seja, a rea sob curva. 4. A funo de distribuio definida como:
F ( x) = f ( x)dx
x
Exemplo
Seja X uma varivel aleatria contnua com a f(x) seguinte funo de densidade. 2
2 x para 0 < x < 1 f ( x) = 0 caso contrrio
1 1 1 2
Exemplo
Funo de distribuio F(x) Para x< 0 Para 0 x < 1 F ( x) = 0 xdx + 0x2 xdx = x 2 0 1 x F ( x) = xdx + 0 2 xdx + 1 0dx = 1 Para x 1
F ( x) = xdx = 0
x
Grfico
X()
Y()
Exemplo: Sejam E=jogar dois dados e (X,Y) pontos dos respectivos dados
Exemplo
0 0 0,10 1 0,04 2 0,06 p(xi) 0,20 1 0,20 0,08 0,12 0,40 2 0,20 0,08 0,12 0,40 p(yj) 0,50 0,20 0,30 1,00
Verificar se X e Y so independentes. Soluo: para todo para i e j; i=j=0, 1, 2 deve-se ter p(xi,yj)=p(xi) p(yj)
Exemplo
Suponha que (X,Y) tenha a seguinte funo de densidade
x + y 0 < x < 1, 0 < y < 1 f ( x, y ) = 0 caso contrrio
Uma seguradora paga R$ 30.000,00 em caso de acidente de carro e cobra uma taxa de R$ 1.000,00. Sabe-se que a probabilidade de que um carro sofra um acidente 3%. Quanto espera a seguradora ganhar por cada carro segurado?
Soluo: Suponhamos que entre 100 carros, 97 do lucro de R$ 1.000,00 e 3 do prejuzo de R$ 29.000,00. Lucro total: 97 1.000 - 3 29.000=10.000,00 Lucro mdio por carro = 10.000,00/100= R$ 100,00 Se chamamos X: lucro por carro e E(X) por lucro mdio por carro, teremos
E(X)=2,7
A esperana de X
x3 1 E ( X ) = 2 xxdx = 2 x 2 dx = 2 = 2/3 3 0 0 0
1 1
A moda m0 =2. Se X contnua tal que f(x) = 2x para 0 x 1 A moda m0 1 e a mediana F(md)=0,5
Md
Para X discreta
2 = ( X i ( X ) ) 2 P( xi ) X
Exemplo
Seja X discreta tal que A esperana de X
3 i =1
X P(X)
-1 0,3
0 0,2
2 0,5
A varincia de X
3 i =1
O desvio padro
X = 1,041 = 1,020
Exemplo
Seja X uma varivel aleatria contnua com a seguinte funo de densidade.
2 x para 0 < x < 1 f ( x) = 0 caso contrrio
Var ( X ) = ( x 2 / 3) 2 2 xdx = 1 / 18
O desvio padro
X = 1 / 18 = 0 , 235
Distribuio de Bernoulli
Uma lmpada escolhida ao acaso Ensaio de Bernoulli A lmpada defeituosa (sucesso)
Nmero de ensaios = 1
Distribuio de Bernoulli
Seja X uma v. com dois resultados possveis: fracasso e sucesso. X x1 =1 sucesso; P(X=1)=p X x1 =0 fracasso; P(X=0)=1-p=q Mdia: X = p Varincia 2 = pq
Distribuio Binomial
3 Ensaios de Bernoulli, n = 3 P(defeituosa)= p =3/7 P(no defeituosa)=1-p= 4/7 Seja X o nmero de defeituosas 1. 2. 3. 4. O experimento consiste de trs ensaios idnticos; Dois resultados so possveis; As probabilidades p e (1-p) so as mesmas em cada ensaio; Os ensaios so independentes.
Distribuio Binomial
P(defeituosa)= p =3/7 P(no defeituosa)= (1-p)= 4/7 Seja X o nmero de defeituosas S= { 111, 110, 101, 011, 001, 010, 100, 000} X = 0 - {000} X = 1 {001, 010, 100} X = 2 - {110, 101, 011} X = 3 - {111} P(001) = 4/7 4/7 3/7= 48/343 P(010) = 4/7 3/7 4/7=48/343 P(100) = 3/7 4/7 4/7=48/343
Distribuio Binomial
Seja X o nmero de defeituosas
3 1 2 P ( X = 1) = (3 / 7 ) (4 / 7 ) 1
Distribuio Binomial
Funo de Probabilidade
n x n x P ( X = x) = ( p ) (1 p ) x
X B(n,p)
Distribuio Binomial
Seja X uma v.a. Binomial com parmetros n e p onde p a probabilidade de sucesso. X {0,1,2,..n} Mdia: X = np Varincia 2 = npq
Exemplo
Considere uma loja de roupas que receba 3 clientes p = o cliente faz compra = 0,30 X- nmero de clientes (1-p) = o cliente no faz compra = 0,70 que compram x p(x) 0 1 2 3
Total
3! (0,30) 0 (0,70) 3 0!3! 3! (0,30)1 (0,70) 2 1!2! 3! (0,30) 2 (0,70)1 2!1! 3! (0,30) 3 (0,70) 0 3!0!
Funo de Probabilidade
Exemplo: Caractersticas
Valor Esperado E(X) = = np Varincia Var(X) = 2 = np(1-p)
Considerando o exemplo, temos E(X) = = 3 0,30 = 0,90 Var(X) = 2 = np(1-p)= 3 0,30 0,70 = 0,63
Distribuio Multinomial
uma extenso da binomial para mais de dois resultados possveis. Seja um experimento que permite ter k resultados diferentes (A1,...Ak) formando o espao amostral. Considere n tentativas deste experimento, sendo que os pi i=1,..,k associados aos k resultados permanecem constantes durante as repeties do k experimento, com pi = 1 i =1 Sejam Xi,..Xk v. as. que so os nmeros de ocorrncias associados aos k resultados possveis com
Distribuio Multinomial
Funo de Probabilidade
n! n n P ( X = n1, ..., X k = nk ) = p1n1 p2 2 .... pk k n1!... nk !
Exemplo
Um dado lanado 10 vezes. Qual a probabilidade de terem aparecido duas vezes o no 2, duas vezes o no 5, trs vezes o no 1 e uma vez os demais resultados? n=10 p1= p2= p3 = p5 = p6 = 1/6 X1=3, X2=2, X3=1,X4=1,X5=2,X6=1
P( X 1 = 3, X 2 = 2, X 3 = 1, X 4 = 1, X 5 = 2, X 6 = 1) =
3 2 1 1 2 1
Exemplo
E(Xi)=nipi e Var(Xi) = n pi qi E(X1)= 10 1/6 =5/3 e Var(X1) = 10 1/6 5/6=50/36 E(X2)= 10 1/6 =5/3 e Var(X2) =10 1/6 5/6=50/36 E(X3)= 10 1/6 =5/3 e Var(X3) = 10 1/6 5/6=50/36 E(X4)= 10 1/6 =5/3 e Var(X4) = 10 1/6 5/6=50/36 E(X5)= 10 1/6 =5/3 e Var(X5) = 10 1/6 5/6=50/36
Distribuio de Poisson
Carros que passam por um cruzamento por minuto, durante uma certa hora do dia. Erros tipogrficos por pgina,em um material impresso. Defeitos por unidade (m2,m, etc) por pea fabricada Mortes por ataque de corao por ano, numa cidade. Problemas de filas de espera
Distribuio de Poisson
Representa a distribuio de probabilidade de uma varivel aleatria que registra o nmero de ocorrncias sobre um intervalo de tempo ou espao especficos.
Exemplo
Suponha que observado o nmero de chegadas a uma caixa automtica de um banco durante um perodo de 15 minutos. A probabilidade de um carro chegar a mesma para quaisquer dois perodos de tempo de igual cumprimento. A chegada ou no chegada de um carro em qualquer perodo de tempo independente da chegada ou no chegada de um outro carro em qualquer outro perodo de tempo.
Exemplo
Suponha que o nmero mdio de carros que chegam no perodo de 15 minutos 10, ento
x e 10 x e = P( x) = x! x!
X- nmero de carros que chegam em qualquer perodo de 15 minutos A probabilidade de 5 chegadas em 15 minutos
105 e 10 = 0,0378 P ( X = 5) == 5!
E(X) = 10 e Var(X) = 10
Distribuio Uniforme
Seja X uma varivel aleatria que representa o tempo de vo de uma aeronave viajando de Chicago at Nova York. Suponha que o tempo de vo pode ser qualquer valor no intervalo de 120 at 140 minutos. Suponha que os intervalos de um minuto so equiprovveis. Parmetro da distribuio: um intervalo
Distribuio Uniforme
X uma v.a. uniformemente distribuda se a sua funo de densidade for dada por
f ( x) = 0 se x < a ou x > b 1 f ( x) = se a x b ba
Logo
Exemplo: X U[3,7]
0.255
f(x)
0.250
0.245 3 4 5 6 7
Distribuio Exponencial
muito til para descrever o tempo que se leva para completar uma tarefa. Ex: O tempo para carregar um caminho considerando que em mdia gasta-se 15 minutos para realizar esta tarefa. Outras situaes tpicas: tempo de chegadas a um lava-jato, tempo de vida de aparelhos, tempo de espera em restaurantes, caixas de banco, etc Parmetro: mdia (ex: tempo mdio) ou valor esperado.
Distribuio Exponencial
X tem uma distribuda exponencial se sua funo de densidade dada por
f ( x) = 0 se x < 0 f ( x) = e x se x 0
Logo
F ( x) = 0 se x 0 F ( x) = 1 e x se x > 0
E(X)=1/ VAR(X)=1/2
Exemplo: X Exp[1]
1.0
f(x)
0.5
0.0 0 1 2 3 4 5 6 7 8 9
Distribuio Normal
Tem sido usada em uma ampla variedade de aplicaes prticas nas quais as variveis aleatrias so: alturas e pesos de pessoas, medies, ndices , etc. Parmetros: mdia e desvio padro. Ex: Os salrios dos diretores das empresas em So Paulo, distribuem-se normalmente com mdia de R$ 20.000,00 e desvio padro de R$ 500,00.
Distribuio Normal
X tem uma distribuda normal se sua funo de 1 x densidade dada por 1 2
2
f ( x) =
, - < x <
Principais caractersticas
O ponto mximo de f(x) o ponto X=. Os pontos de inflexo da funo so: X= + e X= . A curva simtrica com relao a . E(X)= e VAR(X)= 2
N(0,1)
Exemplo: Z N(0,1)
99,72%
Normal Padro
0.4
95,44% 68,26%
f(x)
0.3 0.2 0.1 0.0 -3 -2 -1 0 1 2 3
Exemplo: X N(3,16)
0.10
f(x)
0.05
0.00 -10 0 10 20
3-4
3+4
Probabilidades
0.10
f(x)
0.05
P(-1 X 3 )= P(3 X 7 )
0.00 -10 0 10 20
3-4
3 3+4
Probabilidades
0.4
f(x)
0.3 0.2 0.1 0.0 -3 -2 -1 0 1 2 3
P(-1 Z 0 )= P(0 Z 1)
Z1 =
X1
Z2 =
X2
Conceitos de Estatstica
Conceitos Antigos
a) simples contagem aritmtica Exs: estatstica de asfaltos, mais de 2000 acidentes em seis meses no Estado do Rio de Janeiro. O Estado do Cear tem 679 indstrias A populao do Brasil no ano de 2000 de 169.799.170. b) Sinnimo de dados publicados oficialmente Publicaes tais como: Anurio Estatstico do Brasil, Revista Brasileira de Estatstica, IBGE, Boletim Estatstico.
Conceitos de Estatstica
Exs: O anurio Estatstico do Brasil revelou mais de trs mil milionrios no Braisl. Segundo as estatsticas realizadas pela Organizao Mundial de Sade, ultimamente divulgada, as doenas cardacas constituem a primeira causa de bitos. c) Simples transformao numricas (percentagens, mdias e razes, etc.) Exs: S 35 em 1000 alunos do curso primrio concluem o Secundrio. 58% dos veculos que rodam no pas so nacionais.
Conceitos Antigos
Conceitos de Estatstica
d) Construo de tabelas e grficos
Nmero de Pessoas por Regio e Sexo
Conceitos Antigos
Fonte: DataSus
Tabelas Estatsticas
As tabelas devem obedecer Resoluo n0 886, de 26 de outrubro de 1966, do Conselho Nacional de Estatstica.
ABC Veculos
Perodo Unidades Vendidas 20 10 30
O que refere o fato? Vendas Onde? ABC Veculos Quando? no 10 bimestre de 1996
Sries Estatsticas
qualquer tabela que apresenta a distribuio de um conjunto de dados estatsticos em funo da POCA LOCAL OU ESPCIE
Identifica-se pelo carter varivel do fator cronolgico. O local e a espcie (fenmeno) so elementos fixos..
Vendas no 10 bimestre de 1996 da ABC Veculos, por ms
Perodo Unidades Vendidas 20 10 30
Apresenta como elemento varivel o fator geogrfico. A poca e o fato (espcie) so elementos fixos. Tambm chamada de espacial, territorial ou de localizao.
Vendas no 10 bimestre de 1996 da ABC Veculos, por filial
Filiais So Paulo Rio de Janeiro Total Unidades Vendidas 13 17 30
Fonte: ABC Veculos
3. Srie Especfica
O carter varivel apenas o fato ou espcie. Tambm chamada de srie categrica.
Vendas segundo a marca, no 10 bimestre de 1996 da ABC Veculos
Marca FIAT GM Total
Fonte: ABC Veculos
Unidades Vendidas 18 12 30
4. Distribuio de Freqncias
a srie em que os dados so agrupados com suas respectivas freqncias. 0
Vendas no 1 bimestre de 1996 da ABC Veculos
Nmero de Carros por dia 100 200 Total
Fonte: ABC Veculos
Nmero de de dias 42 18 60
200 300
Populao e Amostra
Populao: grande conjunto de dados que tem as caractersticas de interesse.
Em muitas situaes no possvel acessar todas a populao. Em geral as razes econmicas so as mais determinantes.
Amostra
Inferncia Estatstica
Estimao de quantidades Extrapolao dos resultados Testes de Hipteses
Populao e Amostra
A seleo da amostra pode ser feita e diversas maneiras dependentes entre outros fatores, do grau de conhecimento que temos da populao e de recursos disponveis. A idia que amostra tenta fornecer um subconjuto de valores o mais parecido possvel com a populao que lhe d origem. A amostragem mais usada a casual simples, em que selecionamos ao acaso, com ou sem reposio, os itens da populao que faro parte da amostra.
A amostra
Tipos de Dados
O trabalho estatstico exige um conjunto de dados resultante de uma coleta de informaes extradas da populao. Exemplos: Suponha que um questionrio foi aplicado aos alunos do primeiro ano da escola.
Id: nmero de identificao do aluno Turma: turma em que foi alocado (A ou B) Sexo: F se feminino, M se masculino Idade: idade em anos Altura: altura metros Peso: peso em quilograma Classe social: baixa, mdia ou alta Cada Caracterstica chamada de varivel
Varivel
Caracterstica que pode ser observada (ou mensurada) nos elementos da populao, devendo ter um e apenas um resultado para cada elemento observado.
Classificao de variveis
Nominal Qualitativa Varivel Quantitativa Ordinal Discreta Contnua
Variveis
Qualitativas - O resultado da varivel um atributo ou uma qualidade. Exemplos: tipo de unidade de I/O, tipo de microprocessador, grau de instruo do usurio do sistema, etc. Quantitativas - O resultado um nmero numa escala pr-determinada. Exemplos: quantidade de mquinas ligadas, nmero de transaes por segundo, tempo de resposta, etc.
Variveis Qualitativas
Ordinais - Representam atributos de qualidades com uma ordenao natural Exemplos:
Classe social: A alta, M mdia, C baixa Escolaridade: 1 Primrio 2 Secundrio 3 Superior
No Ordinais (Nominais) - Representam atributos de qualidades sem uma ordenao natural Exemplos:
Sexo: F- feminino M masculino Turma na escola: A ou B Cor: amarelo, branco, verde e azul Hbito de fumar: Sim ou no
Variveis Quantitativas
Discretas - Os resultados possveis formam uma lista finita (geralmente, nmeros inteiros).
Exemplo: quantidade de mquinas ligadas.
Contnuas - Teoricamente, existem infinitos resultados possveis (um intervalo dos nmeros rea
Exemplo: tempo de resposta (em segundos).
Histogramas
Representao grfica de uma distribuio de freqncias por meio de retngulos justapostos O mtodo mais til para descrever resultados obtidos com respeito a uma varivel , sem sombra de dvida, a distribuio de freqncia.
f 8 7 6 5 4 3 2 1 0 122 127 132 137 142 147 152 157 162 167 172 177 182 187 192
Distribuio de Freqncias
poucos intervalos: os grupos se tornam muito abrangentes, impedindo uma maior preciso; muitos intervalos: risco de no realar os aspectos relevantes; def. da amplitude dos intervalos
37,5% das pessoas medidas tem menos de 1,47 m 37,5% de 40 = 15 facum(x) = 15; x=?
f 8 7 6 5 4 3 2 1 0
45 40 35 30 25 20 15 10 5 0
12 2 12 7 13 2 13 7 14 2 14 7 15 2 15 7 16 2 16 7 17 2 17 7 18 2 18 7 19 2
f. acum.
12 2 12 7 13 2 13 7 14 2 14 7 15 2 15 7 16 2 16 7 17 2 17 7 18 2 18 7 19 2
Grau de instruo do chefe da casa, numa amostra de 40 fam lias do Conj. Resid. Monte Verde, Florianpolis, SC, 1988.
Cdigos: 1 - nenhum grau de instruo completo 2 - primeiro grau completo e 3 - segundo grau completo Resultados observados em cada famlia 3 3 2 2 3 1 3 3 3 2 2 1 2 2 3 2 3 3 3 3 3 3 3 2 2 3 1 3 2 3 3 2 3 1 1 1 3 3 3 3
6 11 23 40
Grfico de Barras
Grau de Instruo do Chefe da Casa
segundo grau primeiro grau nenhum
0 4 8 12 16 20 24
nmero de famlias
Grfico em colunas
Grau de instruo do chefe da casa 25 nmero de famlias 20 15 10 5 0 nenhum primeiro grau segundo grau
Grfico de Setor
Grau de Instruo do chefe da casa
nenhum (15,0 %)
Total 360 Parte x
Numa rede de computadores, a quantidade de mquinas que costumam estar ligadas, por dia 20 26 21 21 20 21 23 22 24 22 22 22 23 23 23 22 23 22 24 21
Distribuio de Freqncias
Mquinas Freqncia em uso (absoluta) 20 2 21 4 22 6 23 5 24 2 25 0 26 1 Total 20 Freqncia (relativa) 0,10 (10%) 0,20 (20%) 0,30 (30%) 0,25 (25%) 0,10 (10%) 0 0,05 ( 5%) 1 (100%)
Grfico de Hastes
Freq.
6 4 2
20
21
22
23
24
25
26
Mquinas em uso
7,0 5,4 4,8 9,1 6,3 5,1 8,4 6,2 5,6 6,8 5,0 6,7 8,2 9,9 5,4 5,6 6,0 4,7 18,1 5,3 6,0 6,8 7,3 6,9
7,0 5,4 4,8 9,1 6,3 5,1 8,4 6,2 5,6 6,8 5,0 6,7 8,2 9,9 5,4 5,6 6,0 4,7 18,1 5,3 6,0 6,8 7,3 6,9
18,1
poucos intervalos: os grupos se tornam muito abrangentes, impedindo k = n = 50 = 7,07 = 7 uma maior explicao do comportamento; Estimativa da amplitude muitos intervalos: risco de no realar os aspectos de intervalos relevantes;
Distribuio de Freqncias
Mquinas Freqncia em uso (absoluta) 4.70 |-- 6.62 34 6.62 |-- 8.54 12 8.54 |-- 10.46 3 10.46 |-- 12.38 0 12.38 |-- 14.30 0 14.30 |-- 16.22 0 16.22 |-- 18.14 1 50 Freqncia (relativa) 0,68 (68%) 0,24 (24%) 0,06 (6%) 0 (0%) 0 (0%) 0 (0%) 0,02 ( 2%) 1 (100%)
Histograma do tempo (em segundos) para carga de um aplicativo num sistema compartilhado (50 observaes
40 35 30 Frequencia 25 20 15 10 5 0 5,66 7,58 9,5 11,42 tempo (seg) 13,34 15,26 17,18
Diagramas de Disperso
Um diagrama de disperso serve para saber se existe alguma correlao (forte, fraca, moderada, positiva, negativa, etc.) entre duas variveis.
Grfico de Curvas
Usados em processos para se acompanhar a evoluo de uma varivel em relao a um ou mais limites existentes
Turbidez no Rio Capivari
Turbidez (UNT)
100 80 60 40 20 0
29 /5 12 /4 20 /2 28 /8 16 /1 0 5/ 12 4/ 1 5/ 7
Dia/95
Consideraes
Dados Qualitativos melhor visualizao com grfico de barras, colunas ou circulares (tipo torta); Variveis Discretas (tipo nmero de filhos por comum que utilizemos medidas casal) intervalares para melhor codific-las grfico de hastes (com enumerao natural) com freqncias ou freqncias acumuladas; Variveis contnuas grficos em forma de histograma e polgonos de freqncia.
Consideraes
Muitas vezes precisamos relacionar as variveis em estudo: diagramas de disperso so aconselhveis; Grficos setoriais, particularmente teis para visualizar diferenas entre classes. No acomodam grandes quantidades de categorias
reagrupar as menos importantes em um grupo chamado outros ou, utilizar um grfico de barras, sendo que estas devem vir separadas;
Consideraes
Os grficos tipo torta (setor) permitem uma visualizao das partes em funo do todo. Servem para enfatizar a importncia de um setor (grupo, produto, etc.) frente a outros As sries cronolgicas podem ser representadas por grficos de: colunas, curvas e barras. As sries especficas e geogrficas podem ser representadas por grficos de: colunas, barras e setor.
Medidas
Depois que voc conheceu os conceitos de coleta de dados, variao, causas comuns e causas especiais, chegou a hora de estudarmos algumas formas de medir os resultados. Para melhor interpretar os resultados obtidos com uma amostra, so definidas algumas medidas:
medidas de posio central medidas de posio medidas de disperso.
Mdia Aritmtica
A mdia aritmtica, ou simplesmente mdia, de um conjunto de n valores x1, ..., xn definida como: x1 + ... + xn 1 n X= = xi n n i =1 As letras gregas so usadas para representar parmetros populacionais e as letras comuns parmetros amostrais. A mdia de uma amostra representada por X e mdia de uma populao representada pela letra grega . Exemplo: A mdia aritmtica de 7,5 7,9 8,1 8,2 8,7
X= 7,5 + 7,9 + 8,1 + 8,2 + 8,7 = 8,08
fi X i
Exemplo
Considere os seguintes dados
12,58 14,47 15,17 15,83 16,67 12,97 14,51 15,23 15,98 16,83 13,45 14,53 15,29 16,01 16,97 13,53 14,58 15,37 16,11 17,05 13,59 14,65 15,40 16,17 17,13 13,61 14,78 15,45 16,23 17,22 13,62 14,83 15,51 16,35 17,3 13,78 14,97 15,62 16,43 17,48 13,97 15,06 15,67 16,49 17,8 14,21 15,13 15,73 16,52 18,47
Intervalos de classe
Freqncia absoluta
12,51 a 13,50 13,51 a 14,50 14,51 a 15,50 15,51 a 16,50 16,51 a 17,50 17,51 a 18,50
3 8 15 13 9 2
X=
= 15,46
Exemplo: O exame de seleo pode ser composto de trs provas onde as duas primeiras tem peso 1 e a terceira tem peso 2. Um candidato com notas 70 75 e 90 ter mdia final:
1(70) + 1(75) + 2(90) X= = 81,25 4
Mediana
Dado um conjunto de valores em ordem crescente, a mediana definida como:
Se n impar, o valor central; Se n par, a mdia simples dos dois valores centrais. Exemplos Exemplo 1: Na amostra 25 26 26 28 30 a mediana
~ = 26 x
Exemplo 2: Na amostra 71 73 74 75 77 79 a mediana
12,51 a 13,50 13,51 a 14,50 14,51 a 15,50 15,51 a 16,50 16,51 a 17,50 17,51 a 18,50 1. Calcula-se n/2
3 8 15 13 9 2 50/2=25
3 11 26 39 48 50
terceira classe
14,51 11 0,99
lMd - limite inferior da classe M f - soma das freqncias anteriores a classe da mediana h amplitude da classe da mediana
Moda
A moda o valor que ocorre com maior freqncia, ou seja, o valor mais comum.
Exemplos Exemplo 1: A amostra 23 25 25 26 26 26 27 29 tem moda 26. Exemplo 2: A amostra 71 73 73 75 76 77 77 79 81 tem moda 73 e 77. A moda pode ser mltipla ou pode no existir.
Intervalos de classe
Freqncia absoluta
12,51 a 13,50 13,51 a 14,50 14,51 a 15,50 15,51 a 16,50 16,51 a 17,50 17,51 a 18,50
Mo = l + 1 h
3 8 15 13 9 2
l- limite inferior da classe Modal 14,51 1 diferena entre a freqncia da class modal e a freqncia anterior = 7 2 diferena entre a freqncia da class modal e a freqncia posterior = 2 h amplitude da classe modal =0,99
Existncia
Mdia: existe sempre. Mediana: existe sempre. Moda: pode no existir; pode haver mais de uma moda
G = n X 1X2 .... X n
3 = 13 1 1 1 + + 12 14 16
HG X
O grfico abaixo mostra uma simulao comparativa entre a Mdi Harmnica e a Mdia Aritmtica, calculadas para cinco avalia onde as notas de quatro avaliaes correspondem a 6,0 e a nota da avaliao varia de 0 a 10.
Medidas de Disperso
Invariavelmente as observaes individuais iro apresentar alguma disperso em torno do valor mdio. Isso chamado de variabilidade ou disperso dos dados. H muitas medidas de variabilidade, como por exemplo, a amplitude total, o desvio padro, a amplitude inter-quartlica ou o coeficiente de variao. Os valores mnimos e mximos tambm podem ser usados como medidas de variabilidade
Amplitude total
definida como a diferena entre o maior e o menor valor das observaes. Exemplo : 8,5 8,7 8,9 10,1 10,5 10,7 11,5 11,9 A amplitude total: R = 11,9 - 8,5 = 3,4 A amplitude fcil de calcular e fornece uma idia da magnitude da faixa de variao dos dados. No informa a respeito da disperso dos valores que caem entre os dois extremos.
Desvio Padro
Para uma amostra de n observaes, x1, ..., xn , o desvio padro S definido como: ( xi x )2
S= n 1
A vantagem do desvio padro que trata-se de uma medida de variabilidade que leva em conta toda a informao contida na amostra. O desvio-padro de uma populao representado por e o desvio padro de uma amostra por S.
Medidas de Disperso
As medidas mais utilizadas para representar a disperso a VARINCIA e o DESVIO PADRO. Uma dificuldade que a varincia no expressa nas mesmas unidades dos dados originais.
Desvio Padro
Exemplo: para a amostra 10 12 14 16 18 A mdia x = 14 e o desvio-padro calculado: Os desvios de cada valor em relao mdia totalizam zero pois a mdia o valor central:
10 14 = 4 12 14 = 2 14 14 = 0 16 14 = +2 18 14 = +4
S=
(10 14)2 + (12 14)2 + (14 14)2 + (16 14)2 + (18 14)2
= 3,16
Intervalos de classe
Freqncia absoluta
12,50 a 13,50 13,51 a 14,50 14,51 a 15,50 15,51 a 16,50 16,51 a 17,50 17,51 a 18,50
3 8 15 13 9 2
X = 15,46
3(13 15.46) 2 + 8(14 15.46) 2 + 15(15) 2 + 13(16 15.46) 2 + 9(17 15.46) 2 + 2(18 15.46) S= 50
Varincia
A varincia S2 definida como o quadrado do desvio padro.
S2 =
(x i x )2
n 1
A varincia de uma populao representada pela letra grega 2. A varincia o quadrado do desvio padro, ou seja, 2 =3,16 2 = 9,98
Amplitude Inter-quartlica
definida como a amplitude do intervalo entre o primeiro e o terceiro quartis, ou seja:
Q = Q3 Q1
s vezes tambm usada a semi-amplitude interquartlica, que a metade da anterior. Trata-se de uma medida de variabilidade bastante robusta, que pouco afetada pela presena de dados atpicos. A amplitude inter-quartlica guarda a seguinte relao aproximada com o desvio padro: Q = (4/3) x desvio padro
Coeficiente de Variao
definido como o quociente entre o desvio padro e mdia e, em geral, expresso em percentual.
S CV = 100 X
O coeficiente de variao uma medida dimensional til para comparar resultados de amostras ou populae cujas unidades podem ser diferentes. Uma desvantagem do coeficiente de variao que e deixa de ser til quando a mdia prxima de zero.
Relaes
1o quartil = 25o percentil Mediana = 5o decil =50o percentil 3o quartil = 75o percentil
Se L no inteiro: arredonde L para o prximo inteiro acima dele. Pk L-simo valor da lista ordenada.
Quartis: Exemplo
Exemplo: Para a amostra a seguir calcular o primeiro e terceiro quartis:
13,3 13,5 17,2 13,8 12,3 12,7 13,0 14,5 14,9 15,8 13,1 13,3 14,1
x(i) 12,3 12,7 13,0 13,1 13,3 13,3 13,5 13,8 14,1 14,5 14,9 17,2
i 1 2 3 4 5 6 7 8 9 10 11 13
Exemplo: Quartis
1o quartil = 25o percentil
L=(25/100)13=3,25 L=4 P25=Q1=13,1
i {1,2,3,4,5,6,...,99,100} lPi - limite inferior da classe de Pi f - soma das freqncias anteriores a classe de Pi h amplitude da classe de Pi fPi freqncia da classe Pi
12,51 a 13,50 13,51 a 14,50 14,51 a 15,50 15,51 a 16,50 16,51 a 17,50 17,51 a 18,50
3 8 15 13 9 2
Exemplo
O engenheiro est analisando as espessuras de peas fabricad em duas mquinas de corte. O operador mediu uma pea da mq. A com espessura de 90 mm e outra pea da mq. B com espessura de 100 mm. engenheiro deve considerar esses dados reais ou atpicos? A mq. A possui mdia 51mm e desvio-padro de 12mm.
Mq. A Z =
X X 90 51 = = 3,25 S 12
Exemplo
Supondo que 51 fosse a mdia em uma prova de ingls, onde o desvio padro 12, para um candidato que obtivesse 90 acertos tem-se:
X X 90 51 Z= = = 3,25 12 S
Conclui-se que na prova de ingls este candidato est 3,25 desvios-padro acima da mdia.
Assimetria: skewness
Coeficiente = 0 (Simtrica) Coeficiente > 0 (Assimetria positiva) Coeficiente < 0 (Assimetria negativa)
S1
Clculo da assimetria
Conhecido como primeiro coeficiente de assimetria de Pearson S: desvio padro amostral Mo: moda X : mdia Assimetria assume valores entre -1 e +1
X Mo Sk = S
Curtose: kurtosis
Coeficiente de curtose de Pearson
x )4/n
Aspectos Gerais
A estatstica descritiva tem por objetivo resumir ou descrever caractersticas importantes de dados populacionais ou amostrais conhecidos; A inferncia estatstica tem por objetivo fazer generalizaes sobre a populao em estudo, a partir dos dados amostrais
1 n x = xi n i =1
Um problema
A maioria cr que a temperatura mdia do corpo humano 98,6oF. Uma amostra de dados parece sugerir que a mdia 98,2oF. Sabemos que as amostras tendem a variar, de forma que talvez a verdadeira temperatura mdia seja 98,6oF e a mdia amostral 98,2oF seja resultado de uma flutuao aleatria. Veremos se a temperatura mdia do corpo humano ou no 98,6oF. Dados do problema: n=106, S = 0,62oF e
x = 98 , 20
Estimativa intervalar
(Grandes amostras)
A probabilidade de que uma estimativa pontual coincida com o verdadeiro valor de um parmetro populacional pequena. A estimativa intervalar complementa a estimao pontual. Procuramos um intervalo em torno da estimativa pontual, que acompanhado de uma medida de variabilidade, tenha uma alta probabilidade de conter o verdadeiro valor do parmetro.
Estimativa intervalar
(Grandes amostras)
Assim, um intervalo de confiana (estimativa intervalar) representa uma amplitude de valores que tem probabilidade de conter o verdadeiro valor da populao. Todo intervalo de confiana est associado a um grau de confiana. O grau de confiana (ou nvel de confiana) uma medida que representa a probabilidade do intervalo conter o parmetro populacional. Tal probabilidade chamada de 1- .
Estimativa intervalar
(Grandes amostras)
A construo do intervalo para baseada na distribuio amostral da mdia amostral e no grau de confiana (1- ). No necessrio que a suposio de normalidade para os dados seja adequada.
Transformando X em uma varivel aleatria (VA) normal padro temos: X Z= ~ N (0,1) / n As mdias amostrais apresentam uma chance relativamente pequena de estar em uma das caudas da distribuio normal.
/2 z/2
onde z/2 um valor tal que a rea curva normal padronizada sua direita /2
Assim
- z /2 X - z / 2 n o que equivale a:
X- z/2
n X + z / 2
Resposta do problema
S 0,62 E=1,96 = 1,96 = 0,12 n 106
Como o intervalo acima no contm 98,6oF, parece muito pouco provvel que o valor correto de seja 98,6oF. Devemos rejeitar a hiptese comum de que a temperatura mdia do corpo 98,6oF
Exerccios
Registram-se os valores 0,27; 0,26; 0,27; 0,33; e 0,32 em segundos, obtidos em cinco medies do tempo de fabricao de certo produto. Seja = 0,03. Determine intervalos de confiana com nveis de 95% e 99%, para o tempo real mdio que se requer para fabricar o produto Um prefeito de certa cidade turstica deseja estimar a mdia de gastos para os turistas que visitam a cidade. Com este propsito, uma amostra aleatria de 120 turistas foi selecionada para a investigao e encontrou-se que a mdia foi igual a 800 u.m.(unidades de medidas) com desvio padro de 200 u.m.
Achar o intervalo de confiana, a 99% para a mdia de gastos dos turistas com a cidade. Qual deve ser o tamanho mnimo da amostra para que, ao nvel de confiana de 95%, o erro de estimao seja 20 u.m.
Um problema
Um fabricante de latas deseja diminuir a espessura das latas a fim de reduzir o custo delas. Usualmente a espessura de 0,0282 cm mas o fabricante est testando latas de 0,0278 cm. A carga axial de uma lata o peso mximo suportado por seus lados. Isto medido atravs de uma placa seus lados. importante temos uma carga axial suficientemente grande a fim de a lata no ceder quando se coloca a tampa.
Testes Unilaterais
Testes Bilateral
H0: 1 - 2 = 0 Ha: 1 - 2 0
H0: 1 - 2 0
Ha: 1 - 2 < 0
2 2 1 2 X 1 X 2 = N 1 2 , + n1 n2 d
12
n1
22
n2
1 - 2 = 0
H0: 1 - 2 0
Ha: 1 - 2 < 0
12
n1
22
n2
(1- ) = 0,95
= 0,05
1 - 2 =0
Rejeitar H0 No rejeitar H0
H0: 1 - 2 0
Ha: 1 - 2 < 0
Estatstica do teste
z=
( x1 x2 ) n1 +
12
n2
P(Zz)=0,05
= 0,05
-1,64 Rejeitar H0
0 No rejeitar H0
Rejeitar H0 se z =
( x1 x2 )
12
22
1,64
H0: 1 - 2 0
Ha: 1 - 2 > 0
2 2 1 2 X 1 X 2 = N 1 2 , + n1 n2 d
12
n1
22
n2
1 - 2 =0
H0: 1 - 2 0
Ha: 1 - 2 > 0
(1- ) = 0,95
= 005
1 - 2=0
No rejeitar H0 Rejeitar H0
z / 2
12
n1
22
n2
H0: 1 - 2 0
Ha: 1 - 2 > 0
z=
( x1 x2 )
Estatstica do teste
12
n1
22
n2
(1- ) = 0,95
= 0,05
P(Zz)=0,05
0 No rejeitar H0
1,64 Rejeitar H0
Rejeitar H0 se z =
( x1 x2 )
12
22
1,64
H0: 1 - 2 = 0
Ha: 1 - 2 0
2 2 1 2 X 1 X 2 = N 1 2 , + n1 n2
1 - 2 =0
H0: 1 - 2 = 0
Ha: 1 - 2 0
/2 = 0,025
/2 = 0,0,25
1 - 2=0
z / 2
12
n1
22
n2
Rejeitar H0
No rejeitar H0
Rejeitar H0
H0: 1 - 2 = 0
Estatstica do teste
z=
( x1 x2 ) n1 +
12
22
n2
1- = 0,95
P(Zz)=0,05
/2 = 0,025
/2 = 0,0,25
1,96
Rejeitar H0
0 No rejeitar H0
1,96
Rejeitar H0
Rejeitar H0 sez =
( x1 x2 )
12
22
1.96 ou z =
( x1 x2 )
1.96
z=
( x1 x2 ) s s + n1 n2
2 1 2 2
Usar a tabela t-Student e o nmero de graus de liberdade o menor dentre valor entre n1-1 ou n2 -1.
1. Identifique o parmetro de interesse no problema. Neste caso . 2. Formule a hiptese nula (H0) 3. Formule uma hiptese alternativa apropriada (Ha) 4. Defina o nvel de significncia 5. Estabelea a estatstica usando a distribuio normal quando as varincias populacionais so conhecid ou a distribuio t-Student quando as varincias so estimadas. 6. Estabelea a regio de rejeio usando o nvel de significncia 7. Coletar os dados amostrais e calcular a estatstica do teste 8. Decida se H0 deve ou no ser rejeitada e transponha esta concluso para o contexto do problema
Resposta do problema
H0: 1 - 2 0
Hipteses
Ha: 1 - 2 < 0
1 - carga axial mdia das latas com espessura 0,02 2 - carga axial mdia das latas com espessura 0,02 = 0,05
t=
( x1 x2 ) s1 s2 + n1 n2
2 2
-1,64 Rejeitar H
0 No rejeitar
Resposta do problema
Dados da amostra 1 (carga das lata com espessura 0,0278): x1 = 267,1 n1 = 175 s1 = 22,1 Dados da amostra 2 (carga das lata com espessura 0,0282):
Como t/2 = -1,64 (174 graus de liberdade) existe uma forte evidncia para apoiar a afirmao que as latas de 0,0278 cm tm carga axial mdia inferior das latas de 0,0282 cm
Introduo
Estudar a relao entre duas variveis quantitativas
Exemplos
Idade e altura das crianas Tempo de prtica de esportes e ritmo cardaco Tempo de estudo e nota na prova Taxa de desemprego e taxa de criminalidade Expectativa de vida e taxa de analfabetismo
Correlao Linear
Correlao entre duas variveis quando uma delas est, de alguma forma, relacionada coma a outra. Suposies para medir a correlao:
Dados emparelhados Pares de dados terem distribuio normal bivariada .
Correlao linear mede o grua de relacionamento linear entre os valores emparelhados x e y em uma amostra.
Diagrama de disperso
Exemplo para r = 1
Diagrama de disperso
Exemplo para r = -1
Diagrama de disperso
Exemplo para 0 < r < 1
Diagrama de disperso
Exemplo para -1 < r < 0
Diagrama de disperso
Exemplo para r = 0
Diagrama de disperso
Correlao no linear
Obs. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Estado Tanalf-70 Exvida-70 Tcrime-75 Obs. Estado Tanalf-70 Exvida-70 Tcrime-75 Alabama 2.1 69.05 15.1 26 Montana 0.6 70.56 5 Alaska 1.5 69.31 11.3 27 Nebraska 0.6 72.6 2.9 Arizona 1.8 70.55 7.8 28 Nevada 0.5 69.03 11.5 Arkansas 1.9 70.66 10.1 29 New-Hampshire 0.7 71.23 3.3 California 1.1 71.71 10.3 30 New-Jersey 1.1 70.93 5.2 Colorado 0.7 72.06 6.8 31 New-Mexico 2.2 70.32 9.7 Connecticut 1.1 72.48 3.1 32 New-York 1.4 70.55 10.9 Delaware 0.9 70.06 6.2 33 North-Carolina 1.8 69.21 11.1 Florida 1.3 70.66 10.7 34 North-Dakota 0.8 72.78 1.4 Georgia 2 68.54 13.9 35 Ohio 0.8 70.82 7.4 Hawaii 1.9 73.6 6.2 36 Oklahoma 1.1 71.42 6.4 Idaho 0.6 71.87 5.3 37 Oregon 0.6 72.13 4.2 Illinois 0.9 70.14 10.3 38 Pennsylvania 1 70.43 6.1 Indiana 0.7 70.88 7.1 39 Rhode-Island 1.3 71.9 2.4 Iowa 0.5 72.56 2.3 40 South-Carolina 2.3 67.96 11.6 Kansas 0.6 72.58 4.5 41 South-Dakota 0.5 72.08 1.7 Kentucky 1.6 70.1 10.6 42 Tennessee 1.7 70.11 11 Louisiana 2.8 68.76 13.2 43 Texas 2.2 70.9 12.2 Maine 0.7 70.39 2.7 44 Utah 0.6 72.9 4.5 Maryland 0.9 70.22 8.5 45 Vermont 0.6 71.64 5.5 Massachusetts 1.1 71.83 3.3 46 Virginia 1.4 70.08 9.5 Michigan 0.9 70.63 11.1 47 Washington 0.6 71.72 4.3 Minnesota 0.6 72.96 2.3 48 West-Virginia 1.4 69.48 6.7 Mississippi 2.4 68.09 12.5 49 Wisconsin 0.7 72.48 3 Missouri 0.8 70.69 9.3 50 Wyoming 0.6 70.29 6.9
28
Obs. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Estado Tanalf-70 Exvida-70 Tcrime-75 Obs. Estado Tanalf-70 Exvida-70 Tcrime-75 Alabama 2.1 69.05 15.1 26 Montana 0.6 70.56 5 Alaska 1.5 69.31 11.3 27 Nebraska 0.6 72.6 2.9 Arizona 1.8 70.55 7.8 28 Nevada 0.5 69.03 11.5 Arkansas 1.9 70.66 10.1 29 New-Hampshire 0.7 71.23 3.3 California 1.1 71.71 10.3 30 New-Jersey 1.1 70.93 5.2 Colorado 0.7 72.06 6.8 31 New-Mexico 2.2 70.32 9.7 Connecticut 1.1 72.48 3.1 32 New-York 1.4 70.55 10.9 Delaware 0.9 70.06 6.2 33 North-Carolina 1.8 69.21 11.1 Florida 1.3 70.66 10.7 34 North-Dakota 0.8 72.78 1.4 Georgia 2 68.54 13.9 35 Ohio 0.8 70.82 7.4 Hawaii 1.9 73.6 6.2 36 Oklahoma 1.1 71.42 6.4 Idaho 0.6 71.87 5.3 37 Oregon 0.6 72.13 4.2 Illinois 0.9 70.14 10.3 38 Pennsylvania 1 70.43 6.1 Indiana 0.7 70.88 7.1 39 Rhode-Island 1.3 71.9 2.4 Iowa 0.5 72.56 2.3 40 South-Carolina 2.3 67.96 11.6 Kansas 0.6 72.58 4.5 41 South-Dakota 0.5 72.08 1.7 Kentucky 1.6 70.1 10.6 42 Tennessee 1.7 70.11 11 Louisiana 2.8 68.76 13.2 43 Texas 2.2 70.9 12.2 Maine 0.7 70.39 2.7 44 Utah 0.6 72.9 4.5 Maryland 0.9 70.22 8.5 45 Vermont 0.6 71.64 5.5 Massachusetts 1.1 71.83 3.3 46 Virginia 1.4 70.08 9.5 Michigan 0.9 70.63 11.1 47 Washington 0.6 71.72 4.3 Minnesota 0.6 72.96 2.3 48 West-Virginia 1.4 69.48 6.7 Mississippi 2.4 68.09 12.5 49 Wisconsin 0.7 72.48 3 Missouri 0.8 70.69 9.3 50 Wyoming 0.6 70.29 6.9
28
Modelo de Regresso
Estima ou prev uma varivel aleatria como uma funo de outras variveis aleatrias
Y= f(X)
Y, varivel resposta, varivel dependente X, varivel preditores, variveis independentes
y = b0 + b1 x
b0 e b1: parmetros de regresso determinados a partir dos dados, {(x1, y1), ..., (xn, yn)}.
Regresso Linear
Suposies
Estamos investigando apenas relaes lineares. Para cada par (x,y) uma varivel com distribuio normal. Todas as distribuies de y tem a mesma varincia.
x=1
b0 x x+1
Determinando os parmetros
yi = 0 + 1 xi
i i
yi = b0 + b1 xi
i
e =y y
y
y
Erro
Valor observado da varivel aleatria dependente Valor estimado da varivel aleatria dependente
min SSE =
2 ei
( yi yi )
Resduos
Os parmetros b0 e b1
b0 = y b1 x b1 = xi yi n x y x n(x)
2 i 2
Os parmetros b0 e b1
Onde xi = o valor da varivel independente para a i-sima observao yi = o valor da varivel dependente para a i-sima observao