You are on page 1of 3

Formulario

Variaveis Aleat orias (v.a.):


v.a.s inteiras v.a.s contnuas
Fun cao massa de probabilidade (f.m.p.) Fun cao densidade de probabilidade (f.d.p.)
f : D [0, 1] f : R R
+
0
x f(x) = P(X = x) x f(x)

x
f(x) = 1
_
+

f(x)dx = 1
Fun cao distribui cao (f.d.) Fun cao distribui cao (f.d.)
F(x) = P(X x) =

tx
f(t) F(x) = P(X x) = P(X < x) =
_
x

f(t)dt
P(a < X b) =

b
x=a+1
f(x) = P(a < X b) = P(a < X < b) = P(a X < b) =
= F(b) F(a) = P(a X b) =
_
b
a
f(x)dx = F(b) F(a)
Valor esperado - E[X] =

x
xf(x) Valor esperado - E[X] =
_
+

xf(x)dx
Variancia - V ar[X] = E[(X E[X])
2
] = Variancia - V ar[X] = E[(X E[X])
2
] =
=

x
(x E[X])
2
f(x) =
_
+

(x E[X])
2
f(x)dx
Propriedades Gerais: 1-Se F(x
p
) = p, ent ao x
p
e o quantil de ordem p (0 < p < 1). 2-E[aX + b] = aE[X] + b
a, b R. 3-Sejam X e Y v.a. E[X+Y ] = E[X]+E[Y ]. 4-A vari ancia da v.a. X e dada por: V ar[X] = E[X
2
]E
2
[X].
5-V ar[aX + b] = a
2
V ar[X] a, b R. 6-Sejam X e Y duas v.a. independentes V ar[X + Y ] = V ar[X] + V ar[Y ] e
E[XY ] = E[X]E[Y ].
Distribui c oes:
Bernoulli, B(p): f(x) = p
x
(1 p)
1x
, x = 0, 1. E[X] = p, V ar[X] = p(1 p).
Binomial, B(n, p): f(x) =
_
n
x
_
p
x
(1 p)
nx
, x = 0, 1, 2, . . . , n. E[X] = np, V ar[X] = np(1 p).
Geometrica, G(p):
X n umero de provas ate ao primeiro sucesso (p - probabilidade de sucesso)
f(x) = P(X = x) = (1 p)
x1
p, x = 1, 2, . . . . E[X] = 1/p, V ar[X] = (1 p)/p
2
.
Y n umero de insucessos ate ao primeiro sucesso (Y = X 1)
f(y) = P(Y = y) = (1 p)
y
p, y = 0, 1, 2, . . . . E[Y ] = (1 p)/p, V ar[Y ] = (1 p)/p
2
.
Poisson, P(): f(x) = e

x
/x!, x = 0, 1, 2, . . . . E[X] = , V ar[X] = .
Uniforme, U(a, b): f(x) = 1/(b a), x [a, b]. E[X] = (a +b)/2, V ar[X] = (b a)
2
/12.
Exponencial, E(): f(x) = e
x
, x 0. E[X] = 1/, V ar[X] = 1/
2
.
Normal, N(,
2
): f(x) =
1

2
e

(x)
2
2
2
, x R, R, > 0. E[X] = , V ar[X] =
2
.
Metodo dos Momentos para dois parametros desconhecidos:
_
E[X] =

X
V ar[X] = S
2
Teorema do Limite Central: Sejam X
1
, X
2
, . . . , X
n
v.a.s i.i.d. com media e vari ancia
2
.
(

n
i=1
X
i
) n

n

n
Z N(0, 1)

X
/

n

n
Z N(0, 1).
Em particular: Se X B(n, p)
Xnp

np(1p)

N(0, 1), n ; Se X P()


X

N(0, 1), .
Caractersticas amostrais: Numa amostra aleat oria (X
1
, . . . , X
n
)

X =
1
n

n
i=1
X
i
S
2
=
1
n

n
i=1
(X
i


X)
2
S
2
c
=
1
n1

n
i=1
(X
i


X)
2
Distribui c oes de amostragem: Sejam (X
1
, X
2
, . . . , X
n
) e (Y
1
, Y
2
, . . . , Y
m
) duas amostras aleat orias de popula c oes
Normais com medias
X
,
Y
e vari ancias
2
X
,
2
Y
respectivamente. Seja S
c
D
o desvio padr ao da amostra de
diferen cas X
i
Y
i
quando as amostras est ao emparelhadas, e dena-se S
p
=
_
1
n
+
1
m

(n 1)S
2
c
X
+ (m1)S
2
c
Y
n +m2
quando as amostras s ao independentes.
Estatsticas envolvendo a media amostral

X
X

X
/

n
N(0, 1); IC para
X
:

X z
1/2

n
;

X
X
S
c
X
/

n
t
n1
; IC para
X
:

X t
1

2
,n1
S
c

n
;
Se as amostras forem independentes

X

Y (
X

Y
)
_

2
X
n
+

2
Y
m
N(0, 1); IC para
X

Y
:

X

Y z
1

2
_

2
X
n
+

2
Y
m
;

X

Y (
X

Y
)
S
p
t
n+m2
; IC para
X

Y
:

X

Y t
1

2
,n+m2
S
p
Se as amostras forem emparelhadas

X

Y (
X

Y
)
S
c
D
/

n
t
n1
IC para
X

Y
:

X

Y t
1

2
,n1
S
c
D
/

n.
Se a distribui c ao n ao for Normal, pelo TLC,

X
/

N(0, 1); IC para


X
:

X z
1

n
;

X
S
c
/

N(0, 1); IC para


X
:

X z
1

2
S
c

n
;
Estatsticas envolvendo a vari ancia amostral corrigida
(n 1)S
2
c
X

2
X

2
(n1)
; IC para
2
X
:
_
(n1)S
2
c

2
1

2
,n1
,
(n1)S
2
c

2
,n1
_
S
2
c
X
/
2
X
S
2
c
Y
/
2
Y
F
n1,m1
; IC para

2
X

2
Y
:
_
S
2
c
X
S
2
c
Y
f

2
,m1,n1
,
S
2
c
X
S
2
c
Y
f
1

2
,m1,n1
_
com f
1,,
=
1
f
,,
Propor c oes:
p p
_
p(1 p)/n

N(0, 1) p =
X
n
; IC para p : = p z
1/2
_
p(1 p)
n
.
ANOVA: Compara c ao de medias (ou medianas) de g grupos.
ANOVA parametrica: Todos os grupos devem ter distribui c ao Normal com a mesma vari ancia. Os grupos devem
ter dimens ao n.
SS
T
=

g
i=1

n
j=1
(Y
ij


Y

)
2
SS
G
= n

g
i=1
(

Y
i

)
2
SS
E
=

g
i=1

n
j=1
(Y
ij


Y
i.
)
2
SS
T
= SS
G
+SS
E
Fonte de Varia c ao
Soma de
quadrados
graus de
liberdade
Media dos
quadrados
F
0
p value
Entre Grupos SS
G
g 1 MS
G
=
SS
G
g1
MS
G
MS
E
()
Dentro dos grupos SS
E
g(n 1) MS
E
=
SS
E
g(n1)
Total SS
T
gn 1
Efeitos aleat orios:
2

= (MS
G
MS
E
)/n
ANOVA n ao-parametrica: teste de Kruskal-Wallis.
Compara c oes m ultiplas (pares de medias) Consideram-se todas as compara c oes de pares de medias envolvidas
na ANOVA. Metodo de Bonferroni e de Tukey solucionam a problem atica associada ao nvel de signic ancia
do conjunto de compara c oes (m). Metodo de Bonferroni - reduz o tamanho individual para que o tamanho
total seja o desejado: = m
m
onde
m
e o tamanho de cada compara c ao individual. LSD (Least Signicant
Dierence): compara c oes m ultiplas sem qualquer correc c ao.
Regressao linear Y
i
= b
0
+b
1
x
1,i
+. . . +b
k
x
k,i
+
i
,
i
N(0,
2
), iid. Seja p = k + 1.
S
Y Y
=

n
i=1
(Y
i


Y )
2
SS
R
=

n
i=1
(

Y
i


Y )
2
SS
E
=

n
i=1
(Y
i


Y
i
)
2
S
Y Y
= SS
R
+SS
E
R
2
=
SS
R
S
Y Y
= 1
SS
E
S
Y Y
R
2
a
= 1
SS
E
/(np)
S
Y Y
/(n1)
Estimadores dos par ametros e suas propriedades

2
=
SS
E
n p
(n p)
2

2
=
SS
E

2

2
(np)
T
i
=

b
i
b
i

b
i
t
np
Tabela de regress ao (contem os testes individuais H
0
: b
i
= 0 vs H
1
: b
i
= 0)
Coecientes
n ao-estandardizados
Coecientes
estandardizados
Coeciente b Erro padr ao t p value
Constante

b
0

b
0
t
0obs
()
x
1

b
1

b
1

1
t
1obs
()
x
2

b
2

b
2

2
t
2obs
()
.
.
.
x
k

b
k

b
k

k
t
k obs
()
ANOVA da regress ao (contem o teste ` as hip oteses H
0
: b
1
= b
2
= . . . = b
k
= 0 vs H
1
: b
i
= 0)
Fonte de Varia c ao SS g.l. MS F
0
p value
Regress ao SS
R
k MS
R
=
SS
R
k
MS
R
MS
E
()
Erros SS
E
n p MS
E
=
SS
E
np
Total S
Y Y
n 1
Outras quantidades de interesse:
Valor predito E[Y |x] = (x) = x

b, (x) = x

b :
(x) (x)

_
x

(X

X)
1
x
t
np
Observa c ao futura Y |x = x

b +.

Y |x = x

b:

Y |x Y |x

_
1 +x

(X

X)
1
x
t
np
.
Avalia c ao da qualidade e valida c ao dos pressupostos da regress ao:
Avalia c ao: Diagramas de dispers ao; Gr aco de dispers ao entre os valores observados Y
i
e os preditos (

Y
i
);
Coeciente de determina c ao R
2
; Compara c ao entre a vari ancia dos erros
2
e a vari ancia de Y
i
; Teste ao
signicado da regress ao (ANOVA).
Valida c ao: os resduos (e
i
) devem ser Normais com vari ancia constante e independentes: QQ-plot ou PP-
plot; Gr aco de resduos versus valores preditos

Y
i
.
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Boxplots: barreiras de outliers: Q
1/4
1.5df e Q
3/4
+ 1.5df; barreiras de extremos (outliers severos):
Q
1/4
3df e Q
3/4
+ 3df, com df = Q
3/4
Q
1/4
.
Testes de hip oteses: Num teste de hip oteses a hip otese nula deve ser sempre simples.
p-value do teste: e a probabilidade de observar um valor da estatstica de teste tanto ou mais afastado que o
valor observado na amostra, assumindo que H
0
e verdadeira.
Num teste de tamanho rejeita-se a hip otese nula (de igualdade) quando p-value < .
Para transformar um p-value bilateral em unilateral divide-se por dois desde que a(s) amostra(s) aponte(m) no
sentido da hip otese alternativa. Caso contr ario calcula-se (1p-value/2).
H a 3 procedimentos para realizar um teste de hip oteses:
1. C alculo da regi ao crtica
2. Atraves do p-value.
3. Atraves de intervalos de conan ca (v alido apenas para testes bilaterais). Neste caso rejeita-se H
0
se o valor
em teste n ao pertencer ao IC construdo para o par ametro.

You might also like