Professional Documents
Culture Documents
x
f(x) = 1
_
+
f(x)dx = 1
Fun cao distribui cao (f.d.) Fun cao distribui cao (f.d.)
F(x) = P(X x) =
tx
f(t) F(x) = P(X x) = P(X < x) =
_
x
f(t)dt
P(a < X b) =
b
x=a+1
f(x) = P(a < X b) = P(a < X < b) = P(a X < b) =
= F(b) F(a) = P(a X b) =
_
b
a
f(x)dx = F(b) F(a)
Valor esperado - E[X] =
x
xf(x) Valor esperado - E[X] =
_
+
xf(x)dx
Variancia - V ar[X] = E[(X E[X])
2
] = Variancia - V ar[X] = E[(X E[X])
2
] =
=
x
(x E[X])
2
f(x) =
_
+
(x E[X])
2
f(x)dx
Propriedades Gerais: 1-Se F(x
p
) = p, ent ao x
p
e o quantil de ordem p (0 < p < 1). 2-E[aX + b] = aE[X] + b
a, b R. 3-Sejam X e Y v.a. E[X+Y ] = E[X]+E[Y ]. 4-A vari ancia da v.a. X e dada por: V ar[X] = E[X
2
]E
2
[X].
5-V ar[aX + b] = a
2
V ar[X] a, b R. 6-Sejam X e Y duas v.a. independentes V ar[X + Y ] = V ar[X] + V ar[Y ] e
E[XY ] = E[X]E[Y ].
Distribui c oes:
Bernoulli, B(p): f(x) = p
x
(1 p)
1x
, x = 0, 1. E[X] = p, V ar[X] = p(1 p).
Binomial, B(n, p): f(x) =
_
n
x
_
p
x
(1 p)
nx
, x = 0, 1, 2, . . . , n. E[X] = np, V ar[X] = np(1 p).
Geometrica, G(p):
X n umero de provas ate ao primeiro sucesso (p - probabilidade de sucesso)
f(x) = P(X = x) = (1 p)
x1
p, x = 1, 2, . . . . E[X] = 1/p, V ar[X] = (1 p)/p
2
.
Y n umero de insucessos ate ao primeiro sucesso (Y = X 1)
f(y) = P(Y = y) = (1 p)
y
p, y = 0, 1, 2, . . . . E[Y ] = (1 p)/p, V ar[Y ] = (1 p)/p
2
.
Poisson, P(): f(x) = e
x
/x!, x = 0, 1, 2, . . . . E[X] = , V ar[X] = .
Uniforme, U(a, b): f(x) = 1/(b a), x [a, b]. E[X] = (a +b)/2, V ar[X] = (b a)
2
/12.
Exponencial, E(): f(x) = e
x
, x 0. E[X] = 1/, V ar[X] = 1/
2
.
Normal, N(,
2
): f(x) =
1
2
e
(x)
2
2
2
, x R, R, > 0. E[X] = , V ar[X] =
2
.
Metodo dos Momentos para dois parametros desconhecidos:
_
E[X] =
X
V ar[X] = S
2
Teorema do Limite Central: Sejam X
1
, X
2
, . . . , X
n
v.a.s i.i.d. com media e vari ancia
2
.
(
n
i=1
X
i
) n
n
n
Z N(0, 1)
X
/
n
n
Z N(0, 1).
Em particular: Se X B(n, p)
Xnp
np(1p)
N(0, 1), .
Caractersticas amostrais: Numa amostra aleat oria (X
1
, . . . , X
n
)
X =
1
n
n
i=1
X
i
S
2
=
1
n
n
i=1
(X
i
X)
2
S
2
c
=
1
n1
n
i=1
(X
i
X)
2
Distribui c oes de amostragem: Sejam (X
1
, X
2
, . . . , X
n
) e (Y
1
, Y
2
, . . . , Y
m
) duas amostras aleat orias de popula c oes
Normais com medias
X
,
Y
e vari ancias
2
X
,
2
Y
respectivamente. Seja S
c
D
o desvio padr ao da amostra de
diferen cas X
i
Y
i
quando as amostras est ao emparelhadas, e dena-se S
p
=
_
1
n
+
1
m
(n 1)S
2
c
X
+ (m1)S
2
c
Y
n +m2
quando as amostras s ao independentes.
Estatsticas envolvendo a media amostral
X
X
X
/
n
N(0, 1); IC para
X
:
X z
1/2
n
;
X
X
S
c
X
/
n
t
n1
; IC para
X
:
X t
1
2
,n1
S
c
n
;
Se as amostras forem independentes
X
Y (
X
Y
)
_
2
X
n
+
2
Y
m
N(0, 1); IC para
X
Y
:
X
Y z
1
2
_
2
X
n
+
2
Y
m
;
X
Y (
X
Y
)
S
p
t
n+m2
; IC para
X
Y
:
X
Y t
1
2
,n+m2
S
p
Se as amostras forem emparelhadas
X
Y (
X
Y
)
S
c
D
/
n
t
n1
IC para
X
Y
:
X
Y t
1
2
,n1
S
c
D
/
n.
Se a distribui c ao n ao for Normal, pelo TLC,
X
/
n
;
X
S
c
/
2
S
c
n
;
Estatsticas envolvendo a vari ancia amostral corrigida
(n 1)S
2
c
X
2
X
2
(n1)
; IC para
2
X
:
_
(n1)S
2
c
2
1
2
,n1
,
(n1)S
2
c
2
,n1
_
S
2
c
X
/
2
X
S
2
c
Y
/
2
Y
F
n1,m1
; IC para
2
X
2
Y
:
_
S
2
c
X
S
2
c
Y
f
2
,m1,n1
,
S
2
c
X
S
2
c
Y
f
1
2
,m1,n1
_
com f
1,,
=
1
f
,,
Propor c oes:
p p
_
p(1 p)/n
N(0, 1) p =
X
n
; IC para p : = p z
1/2
_
p(1 p)
n
.
ANOVA: Compara c ao de medias (ou medianas) de g grupos.
ANOVA parametrica: Todos os grupos devem ter distribui c ao Normal com a mesma vari ancia. Os grupos devem
ter dimens ao n.
SS
T
=
g
i=1
n
j=1
(Y
ij
Y
)
2
SS
G
= n
g
i=1
(
Y
i
)
2
SS
E
=
g
i=1
n
j=1
(Y
ij
Y
i.
)
2
SS
T
= SS
G
+SS
E
Fonte de Varia c ao
Soma de
quadrados
graus de
liberdade
Media dos
quadrados
F
0
p value
Entre Grupos SS
G
g 1 MS
G
=
SS
G
g1
MS
G
MS
E
()
Dentro dos grupos SS
E
g(n 1) MS
E
=
SS
E
g(n1)
Total SS
T
gn 1
Efeitos aleat orios:
2
= (MS
G
MS
E
)/n
ANOVA n ao-parametrica: teste de Kruskal-Wallis.
Compara c oes m ultiplas (pares de medias) Consideram-se todas as compara c oes de pares de medias envolvidas
na ANOVA. Metodo de Bonferroni e de Tukey solucionam a problem atica associada ao nvel de signic ancia
do conjunto de compara c oes (m). Metodo de Bonferroni - reduz o tamanho individual para que o tamanho
total seja o desejado: = m
m
onde
m
e o tamanho de cada compara c ao individual. LSD (Least Signicant
Dierence): compara c oes m ultiplas sem qualquer correc c ao.
Regressao linear Y
i
= b
0
+b
1
x
1,i
+. . . +b
k
x
k,i
+
i
,
i
N(0,
2
), iid. Seja p = k + 1.
S
Y Y
=
n
i=1
(Y
i
Y )
2
SS
R
=
n
i=1
(
Y
i
Y )
2
SS
E
=
n
i=1
(Y
i
Y
i
)
2
S
Y Y
= SS
R
+SS
E
R
2
=
SS
R
S
Y Y
= 1
SS
E
S
Y Y
R
2
a
= 1
SS
E
/(np)
S
Y Y
/(n1)
Estimadores dos par ametros e suas propriedades
2
=
SS
E
n p
(n p)
2
2
=
SS
E
2
2
(np)
T
i
=
b
i
b
i
b
i
t
np
Tabela de regress ao (contem os testes individuais H
0
: b
i
= 0 vs H
1
: b
i
= 0)
Coecientes
n ao-estandardizados
Coecientes
estandardizados
Coeciente b Erro padr ao t p value
Constante
b
0
b
0
t
0obs
()
x
1
b
1
b
1
1
t
1obs
()
x
2
b
2
b
2
2
t
2obs
()
.
.
.
x
k
b
k
b
k
k
t
k obs
()
ANOVA da regress ao (contem o teste ` as hip oteses H
0
: b
1
= b
2
= . . . = b
k
= 0 vs H
1
: b
i
= 0)
Fonte de Varia c ao SS g.l. MS F
0
p value
Regress ao SS
R
k MS
R
=
SS
R
k
MS
R
MS
E
()
Erros SS
E
n p MS
E
=
SS
E
np
Total S
Y Y
n 1
Outras quantidades de interesse:
Valor predito E[Y |x] = (x) = x
b, (x) = x
b :
(x) (x)
_
x
(X
X)
1
x
t
np
Observa c ao futura Y |x = x
b +.
Y |x = x
b:
Y |x Y |x
_
1 +x
(X
X)
1
x
t
np
.
Avalia c ao da qualidade e valida c ao dos pressupostos da regress ao:
Avalia c ao: Diagramas de dispers ao; Gr aco de dispers ao entre os valores observados Y
i
e os preditos (
Y
i
);
Coeciente de determina c ao R
2
; Compara c ao entre a vari ancia dos erros
2
e a vari ancia de Y
i
; Teste ao
signicado da regress ao (ANOVA).
Valida c ao: os resduos (e
i
) devem ser Normais com vari ancia constante e independentes: QQ-plot ou PP-
plot; Gr aco de resduos versus valores preditos
Y
i
.
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Boxplots: barreiras de outliers: Q
1/4
1.5df e Q
3/4
+ 1.5df; barreiras de extremos (outliers severos):
Q
1/4
3df e Q
3/4
+ 3df, com df = Q
3/4
Q
1/4
.
Testes de hip oteses: Num teste de hip oteses a hip otese nula deve ser sempre simples.
p-value do teste: e a probabilidade de observar um valor da estatstica de teste tanto ou mais afastado que o
valor observado na amostra, assumindo que H
0
e verdadeira.
Num teste de tamanho rejeita-se a hip otese nula (de igualdade) quando p-value < .
Para transformar um p-value bilateral em unilateral divide-se por dois desde que a(s) amostra(s) aponte(m) no
sentido da hip otese alternativa. Caso contr ario calcula-se (1p-value/2).
H a 3 procedimentos para realizar um teste de hip oteses:
1. C alculo da regi ao crtica
2. Atraves do p-value.
3. Atraves de intervalos de conan ca (v alido apenas para testes bilaterais). Neste caso rejeita-se H
0
se o valor
em teste n ao pertencer ao IC construdo para o par ametro.