Professional Documents
Culture Documents
Cesaltina Pires
Outubro 2003
ii
ndice geral
I
1 Introduo
1.1 Mtodos quantitativos e processo de tomada de deciso . . . . . . . . . . .
3
3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
5
6
8
10
12
12
12
1.3.3 Hipergeomtrica .
1.3.4 Multinominal . . .
1.3.5 Geomtrica . . . .
1.3.6 Binomial Negativa
1.3.7 Uniforme discreta
1.3.8 Poisson . . . . . .
1.4 Distribuies Contnuas .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
13
13
14
14
14
14
15
1.4.1
1.4.2
1.4.3
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Uniforme (Rectangular) . . . . . . . . . . . . . . . . . . . . . . . . . 15
Exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
Normal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2 Programao Linear
2.1 Resoluo Grca . . . . . . . . .
2.1.1 Pontos extremos e soluo
2.1.2 Casos especiais . . . . . .
2.1.3 Anlise de sensibilidades .
. . . . .
ptima
. . . . .
. . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
17
17
21
22
23
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
25
26
26
28
Mtodos Quantitativos
2.3.3
2.3.4
Planeamento da produo . . . . . . . . . . . . . . . . . . . . . . . . 30
3 Teoria de Deciso
33
Critrio Optimista . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.1.2
Critrio Pessimista . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.1.3
3.1.4
Critrio de Laplace . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
3.2.2
Anlise de sensibilidades . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.2.3
3.2.4
3.3.2
3.3.3
3.3.4
Anlise de Sensibilidades . . . . . . . . . . . . . . . . . . . . . . . . 47
4 Teoria de Jogos
49
4.2.2
4.3.2
4.3.3
4.4.2
4.4.3
ndice geral
II
.
.
.
.
.
.
.
.
.
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
. . . .
PERT
. . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
Mtodos Estatsticos
101
.
.
.
.
.
.
.
.
.
.
.
75
75
75
76
76
76
79
79
80
83
92
98
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
. . . . . .
de Lorenz
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
103
. 103
. 104
. 104
. 105
. 107
. 107
. 108
.
.
.
.
.
.
.
.
.
.
109
. 109
. 109
. 111
. 112
. 113
. 113
. 115
. 115
. 115
. 116
Mtodos Quantitativos
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
119
. 119
. 121
. 123
. 124
. 125
. 126
9 Amostragem e estimao
127
9.1 Populao e amostra . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
9.2 Distribuio por amostragem . . . . . . . . . . . . . . . . . . . . . . . . . . 128
9.2.1 Distribuio da mdia da amostra . . . . . . . . . . . . . . . . . . . 130
9.2.2 Distribuio da diferena entre duas mdias . . . . . . . . . . . . . . 131
9.2.3 Distribuio da proporo . . . . . . . . . . . . . . . . . . . . . . . . 132
2
9.2.4 Distribuio de (n1)S
. . . . . . . . . . . . . . . . . . . . . . . . . 132
2
9.3 Estimao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
9.3.1 Propriedades desejveis dos estimadores . . . . . . . . . . . . . . . . 133
9.3.2 Como encontrar estimadores? . . . . . . . . . . . . . . . . . . . . . . 138
9.3.3 Estimao pontual versus estimao por intervalos . . . . . . . . . . 140
9.4 Intervalos de conana para a mdia . . . . . . . . . . . . . . . . . . . . . . 143
9.4.1 Varincia conhecida . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
9.4.2 Varincia desconhecida . . . . . . . . . . . . . . . . . . . . . . . . . 144
9.5 Intervalos de conana para diferena de mdias . . . . . . . . . . . . . . . 145
9.5.1 Varincias conhecidas . . . . . . . . . . . . . . . . . . . . . . . . . . 145
9.5.2 Varincias desconhecidas amostra grande . . . . . . . . . . . . . . 145
9.6 Intervalos de conana para propores . . . . . . . . . . . . . . . . . . . . 146
9.7 Intervalos de conana para varincia . . . . . . . . . . . . . . . . . . . . . 147
9.7.1 Intervalo para varincia de populao normal . . . . . . . . . . . . . 147
9.7.2 Intervalo para rcio de varincias de populaes normais independentes148
9.8 Escolha da dimenso da amostra . . . . . . . . . . . . . . . . . . . . . . . . 149
10 Teste de hipteses
151
10.1 Conceitos bsicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 151
10.2 Ensaio de hipteses sobre a mdia . . . . . . . . . . . . . . . . . . . . . . . 156
ndice geral
10.3
10.4
10.5
10.6
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
12 Regresso mltipla
12.1 Modelo de regresso mltipla . . . . . . . . . . . . . . . . . . . . . . .
12.1.1 Modelo em notao matricial . . . . . . . . . . . . . . . . . . .
12.2 Mtodo dos mnimos quadrados . . . . . . . . . . . . . . . . . . . . . .
12.3 Hipteses do modelo e teorema de Gauss-Markov . . . . . . . . . . . .
12.4 O poder explicativo da regresso . . . . . . . . . . . . . . . . . . . . .
12.5 Intervalos de conana e teste de hipteses de parmetros individuais
12.6 Teste de hipteses sobre conjuntos de parmetros . . . . . . . . . . . .
12.6.1 Teste de aderncia global do modelo . . . . . . . . . . . . . . .
12.6.2 Teste de um subconjunto de coecientes de regresso . . . . . .
12.6.3 Teste de uma combinao linear de parmetros . . . . . . . . .
12.6.4 Teste de vrias combinaes lineares de parmetros . . . . . . .
12.7 Previso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
156
158
160
161
162
162
163
164
.
.
.
.
.
.
.
.
.
165
. 165
. 168
. 169
. 171
. 173
. 174
. 175
. 177
. 179
.
.
.
.
.
.
.
.
.
.
.
.
181
. 181
. 182
. 182
. 184
. 185
. 187
. 189
. 189
. 191
. 191
. 193
. 193
Mtodos Quantitativos
Parte I
Captulo 1
Introduo
1.1
Mtodos Quantitativos
Captulo 1
Introduo
1.2
Reviso de Probabilidades
0 P (A) 1
) Um acontecimento de probabilidade igual a zero indica que no se espera que ele
venha a acontecer. Um acontecimento com probabilidade 1 indica que se espera que
ele acontea quase de certeza.
) Se considerarmos uma experincia com vrios resultados possveis (ex: lanar
um dado ou uma moeda) a soma das probabilidades dada a cada um dos possveis
resultados igual a 1.
) O primeiro passo na anlise denir claramente quais os possveis resultados da
experincia. No lanamento da moeda S = fcaras,coroasg. No lanamento do dado
S = f1; 2; 3; 4; 5; 6g.
) Se tivermos S = fA1; A2; ; Akg, sabemos que 0 P(Aj) 1 e que P(A1) +
P(A2) + P(Ak ) = 1.
Mtodos de estimao de probabilidade
Mtodo objectivo
Mtodos Quantitativos
1.2.1
Conceitos Bsicos
1 1 1
1
+ + = :
6 6 6
2
1
6
Captulo 1
Introduo
P (A \ B)
) probabilidade condicional de A dado B.
P(B)
Mtodos Quantitativos
Gesto
21
14
35
Engenh.
16
4
20
Artes e L.
145
175
320
Medicina
2
13
15
Outros
6
4
10
Total
190
210
400
21
400 = :0525
14
400 = :035
35
400 = :0875
Engenh.
Artes e L.
Medicina
Outros
16
400
4
400
20
400
145
400 = :3625
175
400 = :4375
320
400 = :8
2
400 = :005
13
400 = :0325
15
400 = :0375
6
400 = :015
4
400 = :01
10
400 = :025
= :04
= :01
= :05
Total
190
400
210
400
= :475
= :525
1
) qual P(GestojMasc)?
P(GestojMasc) =
1.2.2
Teorema de Bayes
Este um resultado fundamental que nos indica como rever as nossas crenas
apriori com a chegada de nova informao. Suponha-se que um indivduo estimou
a probabilidade apriori do acontecimento A. Posteriormente o indivduo obteve
a informao adicional de que B aconteceu. A questo , qual a probabilidade
aposteriori de A acontecer?
P(AjB) =
P(A \ B) P(BjA)P(A)
=
:
P(B)
P (B)
Captulo 1
Introduo
de Ei dado A.
P(Ei \ A)
P(Ei \ A)
=
P(A)
P(E1 \ A) + P (E2 \ A) + + P(Ek \ A)
P(AjEi)P(Ei)
=
P(AjE1)P(E1) + P (AjE2)P(E2) + + P (AjEk )P (Ek )
P(EijA) =
P(E1jA) =
A
.27
.02
B
.30
.05
C
.33
.03
Perguntas:
Se uma pea for escolhida aleatoriamente no conjunto de todas as peas, qual
a probabilidade que seja defeituosa?
P(Def) = P (Def \ A) + P(Def \ B) + P (Def \ C)
= :02 + :05 + :03 = :1
Logo, a probabilidade de uma pea ser defeituosa 10%.
10
Mtodos Quantitativos
P (DefjB) =
1.2.3
Distribuies de Probabilidades
Funo cumulativa de probabilidades: para cada valor de x diz-nos qual a probabilidade de a varivel aleatria no exceder x. Isto , F (x) = P(X x).
Captulo 1
11
Introduo
xf (x)
x2R
quando este somatrio existe (este comentrio aplica-se em todas as outras denies).
Ex: Qual o valor esperado da v.a. lanamento do dado?
1
1
1
1
1 + 2 + + 6 = (1 + 2 + 3 + 4 + 5 + 6) = 3; 5
6
6
6
6
Propriedades do Valor Esperado
Se c uma constante, E(c) = c. Porqu?
E [cX] = cE [X].
R cf (x)
=c
R f (x)
= c.
E [X + c] = E [X] + c
Varincia - o valor esperado do quadrado dos desvios em relao a .
X
2 = E (X )2 =
(x )2f (x)
x2R
Propriedades da Varincia
2 = E X 2 2. Porqu? E (X )2 = E X 2 2X + 2 = E X 2
2E [X] + 2 = E X 2 2
Se X v.a. com X e 2X e Y = aX + b ento Y = aX + b e 2X = a2 2X .
12
Mtodos Quantitativos
1.3
1.3.1
Distribuies Discretas
Bernoulli
1.3.2
2 = E(X 2) 2 = 02 (1 p) + 12 p p 2 = p p2 = p(1 p)
Binomial
n!
x!(nx)!
n!
x!(nx)!
Captulo 1
13
Introduo
= np
Porqu? X = X 1 + X2 + + Xn (soma de n Bernolli independentes). Valor esperado
da soma soma dos valores esperados.
Qual a varincia de uma v.a. Binomial?
2 = E(X 2) 2 = np(1 p)
1.3.3
Hipergeomtrica
nx
(N
n)
= np
Porqu? X = X 1 + X2 + + Xn (soma de n Bernolli independentes). Valor esperado
da soma soma dos valores esperados.
Qual a varincia de uma v.a. Hipergeomtrica?
2 =
1.3.4
Nn
np(1 p)
N 1
Multinominal
14
Mtodos Quantitativos
1.3.5
Geomtrica
onde x = 1; 2;
Mdia e Varincia
=
1.3.6
1
p
e 2 =
1 p
p2
Binomial Negativa
1.3.7
r
p
e 2 = r
1 p
p2
Uniforme discreta
1.3.8
m+1
2
2 =
1
m
m2 1
12
Poisson
e x
x!
x = 0; 1; 2;
Mdia e Varincia
= e
2 =
Captulo 1
1.4
15
Introduo
Distribuies Contnuas
Se o conjunto de valores que a v.a. pode tomar for um intervalo ou unio de intervalos
a varivel aleatria contnua. Neste caso a probabilidade de observar um valor em
particular zero. Mas faz sentido calcular
Z b
P(a < x < b) =
f(x)dx
a
A f (x)dx
f (x)dx
E(X) =
1.4.1
xf(x)dx e =
(x )2f (x)dx
Uniforme (Rectangular)
E(X) =
1
;
b a
a xb
a +b
(b a)2
e 2 =
2
12
16
Mtodos Quantitativos
1.4.2
Exponencial
Est relacionada com a Poisson. X- mede o tempo decorrido entre duas ocorrncias sucessivas = tempo de espera at primeira ocorrncia. A funo densidade de probabilidades
1 x
f (x) = e
1.4.3
0 x<1
Normal
Mdia e Varincia
E(X ) = e
Var(X) = 2
Notao X N (; 2 )
Se X N(; 2) e Z =
ento Z N(0; 1)
Captulo 2
Programao Linear
A programao linear estuda a resoluo de um certo tipo de problemas de optimizao. Na formalizao matemtica de qualquer problema de optimizao importante
identicar:
Qual o objectivo a expresso matemtica que descreve o objectivo a funo
objectivo.
) ex: maximizar lucro, minimizar custos.
As variveis de deciso quais so as variveis sobre as quais o agente tem controle. Para alm das variveis de deciso pode haver outras variveis (parmetros) que no esto sob o controle do decisor mas que inuenciam o problema.
) ex. de variveis de deciso: quantidade a produzir.
As restries do problema normalmente as variveis de deciso no podem
tomar valores arbitrrios, h restries que tm que ser levadas em conta.
) ex: restries de capacidade, restries oramentais, restries de no-negatividade.
Em problemas de programao linear a funo objectivo e as restries do problema
so funes lineares.
2.1
Resoluo Grca
18
Mtodos Quantitativos
vitaminas em cada quilo de carne e hortalia, bem como a dose mnima diria destes
nutrientes so apresentadas no quadro que se segue:
Protenas
Vitaminas
Carne
(kg)
8
2
Hortal.
(kg)
4
6
Dose mn.
diria
40
45
4x2
|{z}
40
Captulo 2
19
Programao Linear
x2
conjunto de
oportunidades
x1
x1;x2
sujeito a:
8x1 + 4x2 40;
2x1 + 6x2 45;
x1 0; e x2 0:
20
Mtodos Quantitativos
Captulo 2
21
Programao Linear
x2
ponto
ptimo
conjunto de
oportunidades
rectas de
isodespesa
x1
2.1.1
Vamos usar a resoluo grca para ilustrar uma propriedade muito importante
da soluo dos problemas de programao linear: a soluo ocorre sempre num
dos vrtices ou cantos da regio admissvel. Em programao linear esses
vrtices so chamados pontos extremos da regio admissvel. Os pontos extremos
correspondem a pontos de interseco de restries do problema.
) No problema do Obelix os pontos extremos so: (0; 10), ( 32 ; 7) e ( 45
2 ; 0).
Para ilustrar a ideia mencionada vamos vericar qual seria a soluo se os preos da
hortalia ou da carne se alterassem de forma a fazer mudar a inclinao das rectas
de isodespesa.
Suponhamos que p 1 = 6 e p2 = 6, o que implica que a funo despesa agora
D = 6x1 + 6x2
) neste caso o ptimo ocorre no ponto extremo ( 32 ; 7). A Figura 2.3 ilustra
este caso.
Se p 1 = 2 e p2 = 8 a funo despesa D = 2x1 + 8x2
) neste caso o ptimo ocorre no ponto extremo ( 45
2 ; 0):
22
Mtodos Quantitativos
x2
x1
2.1.2
Casos especiais
Vrios pontos optimizantes Se o declive da curva de nvel da funo objectivo coincidir com o declive duma das restries h uma innidade de pontos que optimizam
a funo objectivo.
Problema impossvel isto corresponde a uma situao em que no existe nenhum
ponto que satisfaa simultaneamente todas as restries do problema. Por outras
palavras, o conjunto de oportunidades um conjunto vazio. Vejamos um exemplo
para ilustrar este caso. Uma empresa produz dois produtos, e usa trs materias
como inputs na produo desses produtos. A tabela seguinte apresenta os materiais
necessrios para produzir uma unidade de cada produto:
Material 1
Produto 1
Produto 2
Quant. Disponvel
2
5
1
2
20
Material 2
0
Material 3
1
5
3
5
3
10
21
Captulo 2
Programao Linear
23
A gesto da empresa diz ao gestor da produo que tem que produzir no mnimo 30
unidades do produto 1 e 15 unidades do produto 2.
Este problema tem 5 restries: 3 referem-se ao montante disponvel de cada material
e duas aos valores mnimos da produo. Seja x1 a quantidade produzida do produto
1 e x2 a quantidade produzida do produto 2. As restries so:
8
2
1
>
>
5 x1 + 2 x 2 20
>
>
<
1x 5
5 2
3
3
> 5 x1 + 10
x2 21
>
>
>
: x 30 e x 15
1
2
2.1.3
Anlise de sensibilidades
24
Mtodos Quantitativos
O intervalo de optimalidade s pode ser utilizado quando apenas um dos coecientes varia. Se os dois coecientes da funo objectivo variarem simultaneamente para vericarmos o que acontece soluo mptima basta vermos o que
acontece ao declive das curvas de nvel da funo objectivo. No exemplo do
Obelix:
p1x1 + p2x2 = D , x2 =
D
p1
p1
p2
|{z}
x1
Captulo 2
25
Programao Linear
x2
conjunto de
oportunidades
x1
A variao no valor ptimo da funo objectivo quando o lado direito de uma restrio aumenta de uma unidade chama-se o preo sombra ou preo dual. O preo
sombra indica-nos o valor que implicitamente o decisor d a ter mais uma unidade
daquele recurso.
) temos que ter cuidado ao usar o preo dual no caso de variaes grandes no lado
direito da restrio. Com variaes grandes pode haver alterao do ponto extremo
ptimo, e as restries que so activas mudam.
) uma restrio que no activa tem um preo dual nulo.
2.2
Para resolver um problema de programao linear com o excel temos que escolher no
menu Tools, e de seguida escolher Solver. O spreadsheet deve estar bem organizado
para facilitar o uso do solver. Uma boa ideia :
Na coluna A por a funo objectivo: Por exemplo, na cela A4 escrever 10
$C$4 + 4 $C$5
Na coluna B por nome das variveis
Deixar a coluna C com as celas livres. Ser a que o excel colocor os valores
ptimos das variveis de deciso. Para alm disso, essas celas so mencionadas
26
Mtodos Quantitativos
2.3
2.3.1
Aplicaes
Seleco do mix de publicidade
Captulo 2
27
Programao Linear
Suponha que os meios publicitrios sua disposio so: anncios na TV, jornal
dirio, revista semanal e anncios no rdio. Na tabela seguinte so apresentados os
custos de cada tipo de anncio, a audincia atingida por cada anncio e o nmero
mximo de anncios por semana.
Anncios na TV
Jornal Dirio
Revista Semanal
Rdio
Audincia
5000
8500
10000
2500
Nomximo de anncios
12
5
1
20
Admita que o oramento para despesas semanais em publicidade 8000 contos. Para
alm disso, um contrato com a rdio obriga-o a colocar no mnimo 5 anncios por
semana. Para alm disso, a gesto no permite que o montante gasto em revistas e
jornais ultrapasse 4000 contos.
O seu maximizar a nmero de consumidores potenciais que cam a conhecer o
produto.
Designemos por x1 o node anncios de TV, x2 o nmero de anncios no jornal, x3
node anncios na revista semanal e x4 o no de anncios na rdio. O problema anterior
formaliza-se da seguinte maneira:
max
s.a.
8
>
>
>
>
>
>
>
>
>
>
>
<
>
>
>
>
>
>
>
>
>
>
>
:
x1 12
x2 5
x3 1
x4 20
800x1 + 925x2 + 1000x3 + 380x4 8000
925x2 + 1000x3 4000
x1 0; x2 0; x3 0 e x4 5
120
37 ; x 3
= 1 e x4 =
200
19 .
28
Mtodos Quantitativos
0 < 12 no activa
< 5 no activa
1 = 1 activa
200 < 20 no activa
19
200
800 0 + 925 120
37 + 1000 + 380 19 = 8000 activa
925 120
37 + 1000 = 4000 activa
x1 0; x2 0; x3 0 e x4 5 no so activas
120
37
2.3.2
Marketing Research
Dia
Noite
20
18
25
20
Captulo 2
C1
C2
S1
S2
29
Programao Linear
n ode entrevistas
n ode entrevistas
n ode entrevistas
n ode entrevistas
durante
durante
durante
durante
o
a
o
a
C2 0:4(C1 + C2 )
S2 0:6(S1 + S2 )
S1 0; C1 0; S2 0 e C2 0
O ponto minimizante : C1 = 240, C2 = 160, S1 = 240 e S2 = 360:
Podemos ainda vericar que a primeira e segunda restries so activas, a terceira e
a quarta no so activas, a quinta e a sexta restries so tambm activas:
240 + 160 + 240 + 360 = 1000
240 + 160 400
240 + 360 400 ) +200 entrevistas do que mnimo exigido a agregados sem crianas
160 + 360 240 + 240 ) +40 entrevistas de noite que mnimo exigido
160 = 0:4(240 + 160)
360 = 0:6(240 + 360)
2.3.3
30
Mtodos Quantitativos
Suponhamos que a empresa Diana Seguros tem neste momento 200 mil euros para
investir e est a considerar comprar aces de 4 empresas diferente. O preo por
aco, a rentabilidade mdia anual e a medida do risco de cada aco a indicada
na tabela seguinte:
Preo por aco
Taxa de rentabilidade
Medida de risco
A
100
0:12
0:10
B
50
0:08
0:07
C
80
0:06
0:05
D
40
0:10
0:08
Admita que a Diana Seguros pretende obter uma rentabilidade mdia superior ou
igual a 9% e que no pode investir mais de 50% em nenhuma das aces.
Qual a carteira de activos que minimiza o risco sujeita s restries de rentabilidade
mdia e de diversicao?
Designando por A, B, C e D o node aces adquiridos de cada uma das empresas, o
problema da Diana Seguros pode formalizar-se:
min 0:1A + 0:07B + 0:05C + 0:08D
sujeito a:
100A + 50B + 80C + 40D = 200000
0:12A + 0:08B + 0:06C + 0:10D 0:09
100A 100000
50B 100000
80C 100000
40D 100000
A 0; B 0; C 0 e D 0
2.3.4
Planeamento da produo
Captulo 2
31
Programao Linear
Consideremos o problema da empresa Eletrnix que produz duas componentes electrnicas para um fabricante de avies. O cliente da Eletrnix informa a empresa das
quantidades necessrias das duas componentes no trimestre seguinte. Admita que a
encomenda recebida pela Eletrnix para o primeiro trimestre do ano :
Componente
402B
505A
Janeiro
2000
1000
Fevereiro
1500
2000
Maro
5000
3000
Mquina (horas/un)
0:1
Trabalho (horas/un)
0:05
Espao (m2/un)
0:02
505A
0:08
0:07
0:05
32
Mtodos Quantitativos
Captulo 3
Teoria de Deciso
Favorvel
1000
500
0
No Favorvel
500
100
0
34
Mtodos Quantitativos
Captulo 3
3.1
35
Teoria de Deciso
Nesta seco vamos estudar critrios de deciso que no requerem o uso de probabilidades. Isto pode ser relevante nos casos em que o decisor tem diculdade em
atribuir probabilidades aos vrios estados da natureza.
3.1.1
Critrio Optimista
Favorvel
1000
500
0
No Favorvel
500
100
0
O critrio optimista muitas vezes designado por critrio maxmax (se o problema
for de mximo) ou minmin (se o problema for de mnimo). A razo para esta nomenclatura prende-se com o processo de encontrar a alternativa ptima. Num problema
de maximizao, por exemplo, a ideia encontrar primeiro o valor mximo em cada
linha da matriz de payos (o melhor resultado possvel para cada alternativa) e,
depois, encontrar o valor mximo entre os valores mximos encontrados para cada
linha (escolher a alternativa com o maior valor mximo).
Designando por Vij o payo que corresponde linha i e coluna j, se o problema
for de mximo o que fazemos :
36
Mtodos Quantitativos
Baixa
30
20
Mdia
30
40
Alta
100
70
3.1.2
Critrio Pessimista
O critrio pessimista avalia cada alternativa considerando o pior resultado que pode
ocorrer se aquela alternativa for escolhida. A alternativa escolhida aquela que tiver
o melhor dos piores resultados.
No nosso exemplo, se a alternativa escolhida for construir uma fbrica grande, o pior
resultado possvel 500. Se a alternativa escolida for construir uma fbrica pequena
o pior resultado possvel 100. Se a alternativa escolhida for no construir fbrica
o pior resultado possvel 0. A alternativa que tem o melhor dos piores resultados
no construir a fbrica.
Fbrica grande
Fbrica pequena
No construir
Favorvel
1000
500
0
No Favorvel
500
100
0
) repare-se que a alternativa escolhida diferente da escolhida com o critrio optimista. O estado da natureza que ocorre sempre o pior possvel, tendo em conta a
alternativa escolhida.
O critrio pessimista muitas vezes designado por maxmin (em problemas de maximizao), ou minmax (em problemas de minimizao). Num problema de maximizao a ideia encontrar primeiro o valor mnimo em cada linha (o pior resultado para
cada alternativa), e depois encontrar o valor mximo entre os mnimos encontrados
Captulo 3
37
Teoria de Deciso
A hiptese implcita neste critrio que a incerteza se resolve sempre contra o decisor.
Aplicando o critrio pessista ao nosso segundo exemplo obtemos:
Fabricar a pea
Comprar a pea
Baixa
30
20
Mdia
30
40
Alta
100
70
3.1.3
A ideia base deste critrio que o decisor quer minimizar a sensao de arrependimento ex-post, isto , depois de conhecer o estado da natureza que ocorreu. Para
aplicar o critrio temos primeiro que calcular a matriz de perdas.
A perda a diferena entre o melhor payo para um dado estado da natureza e o
payo obtido com a alternativa em causa quanto estou arrependido por no ter
escolhida a melhor alternativa. Podemos construir a matriz de perdas a partir da
matriz de payos:
Fbrica grande
Fbrica pequena
No construir
Favorvel
No Favorvel
1000 1000 = 0
1000 500 = 500
1000 0 = 1000
0 (500) = 500
0 (100) = 100
0
Cada alternativa avaliada pela perda mxima que pode ocorrer se alternativa for
escolhida. O critrio recomenda escolher a alternativa com a menor das perdas
mximas.
Neste exemplo, o critrio do minmax regret recomenda escolher a contruo de uma
fbrica grande ou pequena (ambos tm um regret mximo de 500).
Designemos por Vj o valor da melhor alternativa quando ocorre o estado da natureza
sj. A matriz das perdas dada por Vj Vij . Se usarmos o critrio do minmax regret
38
Mtodos Quantitativos
o que fazemos :
Baixa
Mdia
50
0
10
0
Alta
0
30
3.1.4
Critrio de Laplace
Este critrio admite que todos os estados da natureza so igualmente provveis. Por
isso, cada alternativa avaliada considerando o payo mdio que lhe est associado.
A alternativa escolhida aquela que tiver maior payo mdio. Aplicando este critrio
ao nosso primeiro exemplo obtemos:
Fbrica grande
Fbrica pequena
No construir
Favorvel
1000
500
0
No Favorvel
500
100
0
Payo Mdio
1000500 = 250
2
500100
2
= 200
3.2
3.2.1
EMV
1000 34 + (500) 14 = 625
500 34 + (100) 14 = 350
0 34 + 0 14 = 0
Captulo 3
39
Teoria de Deciso
) a alternativa com maior valor monetrio esperado construir uma fbrica grande.
Minimizar o valor esperado da perda (opportunity loss ou regret)
A perda a diferena entre o melhor payo para um dado estado da natureza e o
payo obtido com a alternativa em causa quanto estou arrependido por no ter
escolhida a melhor alternativa. Podemos construir a matriz de perdas a partir da
matriz de payos:
Fbrica grande
Fbrica pequena
No construir
Favorvel
No Favorvel
1000 1000 = 0
1000 500 = 500
1000 0 = 1000
0 (500) = 500
0 (100) = 100
0
3
4
3
4
3
4
0 + 14 500 = 125
500 + 14 100 = 400
1000 + 14 0 = 750
N
X
p(sj)Vij
j=1
j=1
N
X
j=1
j =1
j=1
p(sj)Vj max
i
N
X
p(sj )Vij
j=1
3.2.2
Anlise de sensibilidades
40
Mtodos Quantitativos
3.2.3
Vamos agora ver um conceito muito importante: valor esperado de informao perfeita. Suponhamos que existe uma empresa de analista de mercado que consegue
prever com exactido qual vai ser o estado do mercado. Essa empresa pede 100 para
fornecer essa informao. Eu devo ou no comprar a informao?
Se eu comprar a informao, depois da obter vou saber exactamente qual o estado
da natureza e, por isso, quando estou a decidir sobre a construo da fbrica j estou
a decidir em contexto de certeza. Podem acontecer duas coisas:
Se o estudo disser que o mercado favorvel a deciso ptima construir a
fbrica grande, o que me dar um payo de 1000.
Se o estudo disser que o mercado no favorvel a deciso ptima no construir a fbrica, o que me dar um payo de 0.
Como antes do estudo ser feito eu no sei o que ele vai dizer, s sei que apriori
a probabilidade de o mercado ser favorvel 34 , ex-ante eu s posso calcular
qual o valor monetrio esperado se eu comprar a informao:
3
1
1000 + 0 = 750
4
4
Qual o mximo que eu estou disposta a pagar pela informao perfeita?
a diferena entre o EMV com informao perfeita e o EMV sem informao
perfeita. Ou seja:
EV PI = EMV com IP EMV = 750 625 = 125
Como o valor esperado da informao perfeita superior ao seu custo (125 >
100) eu devo comprar a informao.
Tambm podemos resolver o problema anterior usando uma rvore de deciso. A
Figura 3.1 apresenta a rvore de deciso do problema.
Para resolver o problema devemos resolver do m da rvore para o princpio. Ou
seja, devemos usar backward induction. Assim temos que comear por determinar:
Qual a deciso ptima sobre a fbrica a construir se o estudo for favorvel?
) A deciso ptima construir uma fbrica grande, porque se o estudo for
favorvel sabemos que o mercado vai ser favorvel (porque o estudo perfeito)
) payo 900.
Captulo 3
41
Teoria de Deciso
G
EF
[900]
3/4
NC
G
[650]
E
1/4
[-100]
ENF
P
NC
900
400
-100
-600
-200
-100
[650]
[625]
G
NE
[625]
1/4
[350]
3/4
1/4
NC
[0]
1000
3/4
-500
500
-100
3/4
1/4
42
Mtodos Quantitativos
3.2.4
Captulo 3
43
Teoria de Deciso
0.8
[690]
G
EF
[690]
0.2
0.8
[370]
0.875
0.2
NC
0.8
[-10]
0.2
[620]
990
-510
490
-1 10
-10
-10
E
0.4
[90]
G
0.125
[130]
0.6
0.4
[130]
ENF
0.6
NC
0.4
[-10]
0.6
[625]
[625]
G
NE
[625]
3/4
1/4
[350]
3/4
1/4
NC
[0]
3/4
1/4
990
-510
490
-110
-10
-10
1000
-500
500
-100
0
44
Mtodos Quantitativos
Depois, podemos calcular o valor monetrio esperado se o estudo for feito. Mas
para isso necessitamos de saber qual a probabilidade do estudo ser favorvel ( a
probabilidade do estudo no ser favorvel 1 menos a probabilidade de ser favorvel).
Para calcular essa probabilidade podemos usar o facto de:
P (F) = P (F jEF )P (EF) + P(FjENF )P (ENF)
0:75 = 0:8P(EF) + 0:4(1 P(EF )) , P(EF ) = 0:875
Desta forma, o valor monetrio esperado quando o estudo feito :
0:875 690 + 0:125 130 = 620
Estamos prontos para recuar na rvore e ver se devemos ou no fazer o estudo.
Como o valor monetrio esperdao se o estudo for feito inferior ao valor monetrio
esperado se o estudo no for feito, a deciso ptima no fazer o estudo.
3.3
3.3.1
Uma pergunta: Quem prefere receber 100 euros de certeza ou jogar um jogo em
que com 50% de probabilidade recebe 200 euros e com 50% de probabilidade no
recebe nada?
) Note-se que o valor esperado do rendimento o mesmo nos dois casos:
0:5 200 + 0:5 0 = 100
) No entanto, a maioria das pessoas prefere receber 100 euros com certeza. Porqu?
A maioria das pessoas aversa em relao ao risco. Entre duas alternativas com o
mesmo valor esperado prefere a que tem menor risco.
) Isto est relacionado com as preferncias, e com a forma como o agente valoriza
os resultados bons relativamente aos resultados maus.
Suponhamos que a satisfao do indviduo para os trs nveis de riqueza : U (200) =
80, U(100) = 50, U (0) = 0. Se o agente escolher receber 100 de certeza a sua
utilidade U(100) = 50. Qual a sua utilidade se escolher o jogo? Tendo em conta
Captulo 3
45
Teoria de Deciso
que ao decidir o agente no sabe se W = 200 ou W = 0 vai ocorrer natural que ele
calcule o valor esperado da utilidade:
1
1
1
1
U(200) + U(0) = 80 + 0 = 40
2
2
2
2
) A alternativa com maior valor esperado da utilidade receber 100 euros com
certeza.
3.3.2
Admitindo no saciedade, o agente prefere sempre ter mais do que menos. Isso
signica que a funo de utilidade depende positivamente da riqueza. Ou ainda,
U(W ) uma funo crescente (se for diferencivel a primeira derivada positiva).
A atitude em relao ao risco est relacionada com a curvatura da funo de utilidade.
Se o agente averso em relao ao risco, ento a funo de utilidade concva,
ou seja U 00 (W) < 0.
Se o agente neutro em relao ao risco a funo de utilidade linear, U 00 (W) =
0.
Se o agente amante do risco a funo de utilidade convexa, U 00 (W) > 0.
Para ver isto considere-se um jogo em que com probabilidade 12 recebe-se 2, com
probabilidade 12 recebe-se 0 e a pessoa tem que pagar 1 para jogar. Este jogo um
jogo justo, isto , o seu valor esperado zero.
1
1
2 + 0 1 = 0
2
2
Uma pessoa aversa ao risco prefere no jogar. Mas isso signica que
U(1) >
1
1
U(2) + U(0) , 2U(1) > U (2) + U (0) , U(1) U(0) > U (2) U (1)
2
2
46
Mtodos Quantitativos
Uma pessoa neutra em relao ao risco indiferente. Mas isso signica que
U(1) =
1
1
U(2) + U(0) , 2U(1) = U (2) + U (0) , U(1) U(0) = U (2) U (1)
2
2
1
1
U(2) + U(0) , 2U(1) < U (2) + U (0) , U(1) U(0) < U (2) U (1)
2
2
3.3.3
Captulo 3
47
Teoria de Deciso
Favorvel
10
8
No Favorvel
0
4:2
No construir
EU (W )
3
1
4 10 + 4 0 = 7:5
3 8 + 1 4:2 = 7:05
4
4
3
4
5 + 14 5 = 5
3.3.4
Anlise de Sensibilidades
Fbrica grande
Fbrica pequena
Favorvel
10
8
No Favorvel
0
4:2
No construir
p
EU (W )
10p + (1 p)0 = 10p
8p + 4:2(1 p) = 4:2 + 3:8p
5
1 p
48
Mtodos Quantitativos
0.2
0.4
0.6
0.8
as expresses da utilidade esperada para cada uma das alternativas, possvel determinar os intervalos de p para os quais cada alternativa prefervel. Por exemplo,
para que seja ptimo no construir temos de ter:
5 4:2 + 3:8p e 5 10p
Estas duas condies so verdadeiras p :21053, logo para p 2 [0; :21053] ptimo
no construir. De forma semelhante, para ser ptimo construir a fbrica pequena
tm de ser satisfeitas as duas condies seguintes:
4:2 + 3:8p 5 e 4:2 + 3:8p 10p
o que equivalente a:
p :21053 e p :67742:
Finalmente, para p :67742 ptimo construir a fbrica grande.
Os clculos anteriores mostram que se o decisor estiver conante que a probabilidade
de o mercado ser favorvel superior a 0.68, ento a deciso de construir a fbrica
grande uma boa deciso.
Captulo 4
Teoria de Jogos
4.1
50
Mtodos Quantitativos
Um pouco de histria
A expresso teoria de jogos foi usada pela primeira vez por Von-Newman e
Morgenstern (1944). Eles analisaram jogos de soma-zero. Um jogo de somazero um jogo em que aquilo que um jogador ganha igual aquilo que o outro
perde.
Apesar disso, ideias que so ideias de teoria de jogos foram usadas muito antes.
Alguns exemplos:
1700s Jean Jacques Rosseau
4.2
4.2.1
Captulo 4
U
D
51
Teoria de Jogos
L
1; 2
3; 6
R
3; 4
7; 8
1
2
l
3,4
r
5,6
52
Mtodos Quantitativos
ui : S ! <:
Qual o payo do jogador i para cada vector de estratgias. ui (s1 ; s2; ; sn) indicanos o payo do jogador i quando o jogador 1 escolhe s1, o jogador 2 escolhe s2, ,
e o jogador n escolhe sn .
Resumindo, um jogo na forma normal descrito por:
= fN; S1; S2; ; Sn; u1; u2 ; ; ung
Exemplos:
Dilema do prisioneiro
U
D
L
1; 1
0; 5
R
5; 0
4; 4
Futebol
1; 2
0; 0
Balet
0; 0
2; 1
Captulo 4
53
Teoria de Jogos
Forma extensiva
Quais so os elementos da representao na forma extensiva
Quem so os jogadores?
Quem que est a decidir?
O que que cada jogador pode fazer quando ele a mover-se?
O que que os jogadores sabem quando decidem?
Quais so os payos no nal?
) quem que est a decidir, o que pode fazer, o que sabe, so equivalentes questo
de quais so as estratgias de cada jogador, na representao em forma normal.
Noo de estratgia
Uma estratgia um plano completo de aco que especica qual a aco que o
jogador escolheria em todas as contigncias em que o jogador venha a ter que jogar.
) uma estratgia algo que se pode dar ao nosso advogado e ir para casa descansar
(o advogado pode executar as instrues e nunca ter dvidas sobre o que deve
fazer, porque a estratgica indica o que fazer em qualquer circunstncia que venha
a ocorrer).
L
2
2
1
2
2
1
2
3
3
O jogador 2 quando decide sabe o que que o jogador 1 fez ) o jogo sequencial:
o jogador 1 decide primeiro entre L e R e, depois de observar a escolha do jogador
1, o jogador decide entre l e r.
54
Mtodos Quantitativos
3,4
1
2,1
1,1
2,0
Neste jogo as estratgias do jogador 1 so: RA, RB, LA, LB. Como explicar LA e
LB?
verdade que se o jogador 1 escolher L a escolha entre A e B nunca se coloca. Mas
quando falarmos da soluo do jogo veremos que a deciso do jogador entre L e R
depende daquilo que ele pensa que o jogador 2 vai fazer, e , por sua vez, aquilo que
o jogador 2 vai fazer depende daquilo que ele pensa que o jogador 1 faria se tivesse
que escolher entre A e B. por isso que o jogador 1 vai mesmo ter que pensar no
que faria se tivesse que decidir entre A e B.
) A noo de estratgia em teoria de jogos mais do que um plano completo de
aco, porque tem especicar o que jogador faria mesmo em contigncias que nunca
ocorreriam se o jogador implementasse a sua estratgia.
Captulo 4
55
Teoria de Jogos
Conjunto de informao
F
2
1
2
0
0
0
0
2
1
l
1,5
3,7
r
2,5
4,8
56
Mtodos Quantitativos
L
2
1,5
2,6
3,7
4,8
L
2
1,2
3,4
5,6
7,8
L
R
(l; l)
1,2
5,6
(l; r)
1,2
7,8
(r; l)
3,4
5,6
(r; r)
3,4
7,8
) importante salientar que a forma extensiva reecte melhor a estrutura da informao e melhor para atribuir crenas a cada um dos ns de um conjunto de
informao.
Captulo 4
4.2.2
Teoria de Jogos
57
4.3
Agora que j sabemos como representar jogos podemos estudar como encontrar a
soluo do jogo. Vamos admitir que os jogadores decidem as suas estratgias
independentemente e que S nito.
Na nossa anlise no vamos considerar estratgias mistas. Mas importante referir
que os conceitos apresentados se generalizam quando se admite que os jogadores
podem escolher estratgias mistas.
S para terem uma ideia do que uma estratgia mista consideremos o jogo da
guerra dos sexos:
Futebol
Ballet
Futebol
1; 2
0; 0
Ballet
0; 0
2; 1
1
2
58
Mtodos Quantitativos
4.3.1
confessar
1; 1
0; 5
no confessar
5; 0
4; 4
U
M
D
L
5; 1
6; 0
6; 4
R
4; 0
3; 1
4; 4
Captulo 4
59
Teoria de Jogos
) Note-se que uma estratgia dominada no sentido fraco no pode ser eliminada s
com base na ideia de racionalidade. Por exemplo, jogar M uma estratgia ptima
se o jogador 1 tiver a certeza que o jogador 2 escolhe L.
) Contudo, se o jogador 1 atribuir uma pequena probabilidade ao jogador 2 jogar
R, ele nunca deveria escolher M (esta ideia conhecida na literatura como trembling
hand).
Eliminao iterada de estratgias estritamente dominadas
) jogadores racionais no jogam estratgias estritamente dominadas
) do conhecimento comum que os jogadores so racionais
Exemplo:
U
D
L
1; 0
0; 3
M
1; 2
0; 1
R
0; 1
2; 0
) Como sabe que o jogador 2 racional, o jogador 1 sabe que o jogador 2 nunca
jogar R. Mas ento o jogador 1 nunca querer jogar D, porque uma vez elimada R
a estratgia D estritamente dominada por U .
) O jogador 2 sabe que o jogador 1 sabe que ele racional. Ou seja, o jogador 2
sabe que 1 sabe que ele nunca jogaria R. Para alm disso, o jogador 2 sabe que 1
tambm racional e, por conseguinte, nunca jogar D. Mas ento o jogador 2 nunca
jogar L.
) Neste jogo, o nico vector de estratgias que sobrevive eliminao iterada de
estratgias estritamente dominadas o vector (U; M).
Outro exemplo:
U
M
D
L
4,3
2,1
3,0
M
5,1
8,4
9,6
R
6,2
3,6
2,8
U
M
D
L
4,3
2,1
3,0
R
6,2
3,6
2,8
L
4,3
R
6,2
60
Mtodos Quantitativos
) Uma vez eliminada a estratgia M do jogador 2, M e D so estritamente dominadas por U para o jogador 1.
) (U; L) a soluo do jogo usando IDDS.
Um resultado muito importante que o conjunto de estratgias que sobrevive a
eliminao iterada de estratgias estritamente dominadas no depende da ordem em
que as estratgias so eliminadas.
No faz sentido usar eliminao iterada de estratgias fracamente dominadas, porqu?
A eliminao de estratgias fracamente dominadas justicada quando um jogador
d probabilidade positiva a todas as estratgias dos seus oponentes. Mas, isto contradiz a lgica da eliminao iterada, que baseada na ideia que estratgias dominadas no so esperadas ocorrer.
4.3.2
U
D
L
8; 10
7; 6
R
100; 0
6; 5
(U; L) o nico par de estratgias que sobrevive eliminao iterada de estratgias estritamente dominadas.
Contudo, se o jogador 1 no tiver a certeza que o jogador 2 racional e atribui
alguma probabilidade ao jogador 2 jogar R, ele pode car melhor se jogar D.
Neste jogo, porque os payo so muito extremos, o resultado muito sensvel
a pequenas incertezas no comportamento (mesmo que a probabilidade de 2 ser
irracional seja s 1%, o suciente para o jogador 1 preferir D).
Quanto mais elevado for o nmero de iteraces, menos credvel a soluo porque
necessitamos de um nmero maior de rounds do tipo eu sei que t sabes que eu
sei.... A hiptese de que a racionalidade do conhecimento comum signica que
mesmo que haja um nmero innito de rounds no h problema.
Captulo 4
61
Teoria de Jogos
4.3.3
) O EN tal que as conjecturas acerca da forma como o jogo vai ser jogado so
internamente consistentes. Isto , se todos os jogadores prevm que um determinado
equilbrio de Nash vai ocorrer, ento nenhum dos jogadores tem incentivo a desviarse e jogar de forma diferente.
) Para vericar se um determinado vector de estratgias EN basta vericar se
ningum, unilateralmente, tem interesse em desviar-se.
) O EN tem implcitas duas ideias: crenas so mutuamente correctas e as estratgias de cada jogador so ptimas dadas as crenas.
Como vericar se um dado vector de estratgias EN?
U
D
L
2; 3
1; 2
R
1; 2
2; 4
) ser que (U; L) um EN? Se o jogador 2 jogar L, o jogador 1 quer jogar U. Ele
no quer desviar-se porque se jogar U obtm 2, enquanto que se jogar D obtm 1.
62
Mtodos Quantitativos
De forma semelhante, se o jogador 1 jogar U, o jogador 2 tambm no quer desviarse, porque recebe um payo de 3 se jogar L, e s recebe 2 se jogar R.
Por conseguinte, (U; L) EN.
Como encontrar os equilbrios de Nash?
Para encontrar o(s) equilbrio(s) de Nash de um jogo o que se faz deduzir as funes
melhor resposta (s vezes designadas por funes de reaco) e, depois, encontrar
o(s) vectore(s) de estratgias para os quais todos os jogadores esto em simultneo
nas suas funes de reaco.
O que a funo melhor resposta do jogador i?
A funo melhor resposta diz-nos, para cada vector de estratgias dos outros
jogadores, qual a estratgia ptima do jogador i. A estratgia ptima do
jogador i depende do vector de estratgias dos outros jogadores. BR i(si ).
Para encontrar a funo melhor resposta temos que resolver o problema:
max ui (si ; si)
si
U
D
L
2; 3
1; 2
R
1; 2
2;4
U
D
L
0;3
1; 2
R
2; 2
2;4
Captulo 4
63
Teoria de Jogos
a qj c
2 }
| {z
O equilbrio de Nash :
(
qi =
qj =
aqj c
2
aqi c
2
ac
qi = qj =
3
No confessar
1; 1
0; 5
Confessar
5; 0
4; 4
) Um resultado em que no possvel aumentar a utilidade de um indivduo sem que nenhum outro indviduo piore designa-se por ptimo de Pareto.
Claramente, (4; 4) no um ptimo de Pareto.
) Como vimos atrs, este jogo pode ser resolvido usando eliminao de estratgias estritamente dominadas. O resultado obtido com esse procedimento
exactamente o mesmo que usando o conceito de equilbrio de Nash. Este
facto no um mero acaso. Sempre que s exista um resultado que sobrevive a
eliminao iterada de estratgias estritamente dominadas, ento esse tambm
o nico equilbrio de Nash do jogo.
H jogos com vrios equilbrios de Nash ) pode ser difcil prever qual vai ser
o resultado do jogo.
64
Mtodos Quantitativos
Futebol
Balet
Futebol
1;2
0; 0
Balet
0; 0
2;1
Futebol
2;2
0; 0
Balet
0; 0
4;4
) Este jogo tambm tem dois EN em estratgias puras. Mas aqui o problema
de coordenao pode ser mais fcil. Os payos com o equilbrio (B; B) dominam
no sentido de Pareto os payos do equilbrio (F; F ). Neste caso, (B; B) um
equilbrio mais natural do que (F; F ).
) jogar na aula um jogo em que 2 jogadores fazem pedidos entre 0 e 100
euros. Se a soma dos dois montantes igual 100, os 100 euros so repartidos de
acordo com os pedidos. Se no os dois montantes no somarem 100 os jogadores
recebem ambos zero. O ponto focal 50.
Pode no existir equilbrio em estratgias puras
Jogo das moedas
H
T
H
1; 1
1;1
T
1;1
1; 1
Jogo de inspeco
preguiar
trabalhar
Inspecionar
0;h
w g; v w h
No inspecionar
w; w
w g;v w
Captulo 4
Teoria de Jogos
65
66
Mtodos Quantitativos
4.4
A maioria dos exemplos de gesto e economia envolve os jogadores a tomarem decises ao longo do tempo. Por exemplo, as empresas tomam hoje decises de investimento que afectam a sua competitividade no futuro. Uma negociao entre a
empresa e os trabalhadores pode envolver uma srie de ofertas e contra ofertas.
Isto signica que muitos jogos so dinmicos.
O conceito central em jogos dinmicos equilbrio perfeito em todos os subjogos. A
ideia principal por detrs deste conceito o princpio da racionalidade sequencial:
os jogadores devem jogar de forma ptima seja qual for o ponto do jogo em que se
encontrem..
4.4.1
L
R
l
1;2
2;1
r
1;2
0; 0
Captulo 4
67
Teoria de Jogos
1,2
l
2,1
0,0
No entrar
Entrar
Lutar se E entrar
Acomodar se E entrar
0;2
3; 1
0;2
2;1
68
Mtodos Quantitativos
O jogo tem dois EN em estratgias pura (No entrar, lutar se E entrar) e (Entrar,
acomodar se E entrar). No entanto o primeiro deste EN no razovel. Porqu?
Porque se a empresa E entrar a empresa I no quereria implementar a sua ameaa
de lutar. Lutar se E entrar no uma ameaa credvel, porque se E entrar
melhor para empresa instalada acomodar.
) O princpio da racionalidade sequencial que diz que a estratgia de cada jogador
deve especicar decises ptimas seja qual for o ponto da rvore elimina o EN(No
entrar, lutar se E entrar).
Se usarmos backward induction obtemos resultados razoveis. Backward induction
signica resolver o jogo do m para o princpio. Comeamos por estudar qual a
deciso ptima do ltimo jogador a jogar, em cada um dos ns em que ele tem que
decidir. Repare-se que ao fazer isto estamos a resolver um problema de deciso individual. Assim que tivermos encontrado a aco ptima do ltimo jogador, recuamos
na rvore para os ns em que o jogador anterior se move e voltamos a encontrar
a aco ptima para este jogador, e recuamos novamente na rvore. O processo
continua at chegarmos ao incio do jogo.
) A ideia implicta na induo retrospectiva a de que o o primeiro jogador a jogar,
antes de tomar a sua deciso, antecipa a forma como os outros jogadores vo decidir
mais tarde, tendo em conta que eles so racionais e escolhero de forma ptima. Num
certo sentido, para resolver o seu problema o primeiro jogador tem que resolver o
problema dos jogadores seguintes.
Vamos aplicar backward induction nos dois exemplos acima
Captulo 4
69
Teoria de Jogos
Resolvendo obtemos
a c q1
2
) Note-se que isto dene a estratgia ptima da empresa 2, diz-nos queal o
valor ptimo de q2 para cada valor de q1 que possa ocorrer.
q2 =
a c q1
max a q1
q1 cq1
q1
2
acq1
2
@1
a c q1 q1
a c
= a q1
c = 0 , q1 =
@q1
2
2
2
Logo o resultado do jogo, usando backward induction q1 =
) A empresa 1 (a lder) produz mais que no jogo simultneo
ac
2
e q2 =
ac
4 .
70
Mtodos Quantitativos
O problema do Principal-Agent
Consideremos uma relao bilateral em que uma parte contrata outra parte para
executar uma determinada aco. O contratante o principal, o contratado o
agente.
Exemplo: uma contrata um gestor. O lucro da empresa, ; uma varivel estocstica que depende do nvel de esforo do gestor, e. O dono da empresa observa o lucro
obtido mas no observa o nvel de esforo realizado pelo gestor. A empresa oferece
um contrato ao gestor, w() que especica o salrio que este recebe como funo do
lucro obtido (o esquema de incentivos).
Isto um jogo dinmico de informao perfeita: no primeiro estgio do jogo a
empresa oferece w(), depois de observar w() o gestor decide se aceita ou no o
contrato. Se aceitar o contrato, o gestor decide depois o nvel de esforo. De seguida,
a natureza escolhe o estado da natureza (o valor de ).
O jogo pode ser resolvido usando backward induction.
4.4.2
I
2
p2
1
p1
p1
Captulo 4
71
Teoria de Jogos
L
3
Exemplo: Consideremos outra vez o jogo da predao, mas com uma variante: se a
empresa E entrar temos um jogo simultneo entre as duas empresas, em que cada
uma delas pode lutar ou acomodar. A Figura 4.11 apresenta este jogo em
forma extensiva:A forma normal do jogo :
Acomodar se E entrar
Lutar se E entrar
0;2
0;2
2;1
1; 2
0;2
0;2
2; 1
3;1
72
Mtodos Quantitativos
-2,-1
1,-2
Este jogo tem trs EN em estratgias puras, mas dois deles no so razoveis. Vamos
encontrar o equilbrio perfeito deste jogo. Comecemos por resolver o jogo simultneo
do segundo estgio do jogo. A forma normal deste subjogo :
Acomodar
Acomodar
Lutar
2;1
1; 2
Lutar
2; 1
3;1
O nico eN deste subjogo (acomodar, acomodar). Logo um equilbrio perfeito em todos os subjogos deve especicar que no segundo estgio do jogo a estratgia de continuao
das empresas acomodar.
Recuando na rvore vericamos que a empresa E obtm 0 se no entrar e obtm 2 se
entrar. Por conseguinte, o nico equilbrio perfeito consiste na empresa E entrar e ambas
empresas acomodarem no segundo estgio do jogo.
4.4.3
Backward Induction funciona por instrospeco. Mas, quais as hipteses sobre o que
os jogadores sabem acerca dos outros?
O jogador 3 joga R porque racional. O jogador 2 conhece os payos do jogador 3
e sabe que ele racional, logo sabe que ele vai jogar R. Por conseguinte, o jogador
Captulo 4
73
Teoria de Jogos
2,2,2
R
3
1,1,1
4,4,4
0,0,0
D1
(1,0)
A1
D2
(0,1)
A2
D3
(3,0)
A3
D4
(2,4)
A4
A5
(5,5)
D5
(6,3)
74
Mtodos Quantitativos
Captulo 5
Quando estudmos os vrios sistemas de produo vimos que a produo por projecto se
utiliza na produo de um nico produto/servio. A produo por projecto aplica-se a uma
basta gama de produtos manufacturados e servios. A construo de edcios, a construo
de navios e avies so feitas por projecto. Servios como lmes, projectos de investigao e
desenvolvimento, ensinar uma disciplina so feitos por projectos. Para alm disso, muitas
das actividades das empresas tambm so organizados como projectos. Actividades como a
concepo de produtos novos, a automatizao da produo, a implementao de sistemas
de gesto da qualidade so organizadas como projectos. Por esta razo, o planeamento, a
programao e o controlo de projectos so essencias em qualquer organizao.
5.1
5.1.1
76
Mtodos Quantitativos
5.1.2
Tipos de deciso
A gesto de projectos envolve vrios tipos de deciso: decises de planeamento, programao e controlo. As decises de planeamento ocorrem no nicio do projecto e estabelecem
os objectivos principais do projecto, os recursos necessrios, a forma de organizao, as
pessoas que vo ser responsveis pelo projecto.
A fase de programao especica de maneira mais detalhada o plano do projecto. Nesta
fase comea por se elaborar uma lista detalhada das actividades necessrias para completar
o projecto, e a sequncia em que essas actividades tm de ser realizadas indicada. Com
esta informao constro-se o calendrio do projecto. Um outro elemento importante
oramento do projecto, sendo normalmente indicados o calendrio dos custos. Por ltimo,
o programa deve especicar a forma como o pessoal do projecto afectado a cada uma
das actividades do projecto.
medida que o projecto vai sendo executado importante vericar se a implementao
est de acordo com o planeado, tanto em termos de custo, como de tempo, como de
qualidade. Quando existe uma discrepncia entre o resultado vericado e o plano devem
tomar-se medidas no sentido de corrigir os problemas identicados. Estas medidas podem
incluir a reviso do programa, mudanas na afectao de pessoal, realocao de fundos.
5.2
5.2.1
Representao do projecto
Identicao das actividades
Captulo 5
77
Grco de Gantt
O grco de Gantt um grco de barras onde cada coluna corresponde a uma unidade
de tempo e cada linha a uma actividade a realizar. Para cada actividade denida uma
barra horizontal, correspondendo o seu comprimento durao da tarefa. A posio de
cada barra no grco vai depender das ligaes entre as vrias actividades.
A ideia comear por representar as actividades que no tm nenhuma actividade
precedente. De seguida, representam-se as actividades que tm como actividades precedentes as actividades j representadas, e por a diante...
Para alm das actividades, no grco de Gantt tambm se podem representar acontecimentos (para indicar o m de uma etapa importante, por exemplo). Os acontecimentos
correspondem a um momento do tempo, enquanto as actividadades so tarefas com uma
determinada durao.
Exemplo 5.1 Um determinado projecto envolve 5 tarefas: A; B; C; D e E. A tarefa A
demora 1 dia, a tarefa B dura 4 dias, a tarefa C dura 2 dias, a tarefa D dura 1 dia e a
tarefa E dura 3 dias. Para alm disso, as tarefas B e C s podem ser realizadas depois
de A, a tarefa D depois de C e a tarefa E depois de B e D. O grco de Gantt deste
projecto est representado na Figura 5.1.
78
Mtodos Quantitativos
Rede de actividades
Na representao em rede, cada uma das actividades representada por um arco orientado.
Para alm dos arcos, uma rede tambm possui ns, que representam acontecimentos. Um
n corresponde nalizao das actividades que nele convergem, o que implica que se
pode dar incio s actividades que dele emergem. Na Figura 5.2 est representado a rede
de actividades do Exemplo 5.1. A rede indica claramente a sequncia das actividades: B e
C s podem iniciar-se depois de A estar concluda, D s pode iniciar-se depois de C estar
concluda. B e D tem de estar concludas antes de E se iniciar.
O comprimento dos arcos orientados no depende da durao da tarefa. Na representao em rede, a durao de cada actividadde est indicada entre parentses.
Nvel de pormenor
Uma questo interessante qual o nvel de pormenor que se deve considerar na decomposio do projecto em actividades? claro que se nos limitarmos a indicar somente as
macro-actividades obteremos uma rede relativamente simples e de fcil anlise, mas que
pode no ser a mais adequada para efeitos de planeamento e controlo do projecto. Em
contrapartida, se quisermos ir ao nvel das actividades elementares, a descrio do projecto
ser mais completa, mas a rede ser tambm complexa, o que dicultar a sua anlise.
O nvel de pormenor depender do efeito para o qual a rede vai ser usada. Se a descrio
do projecto for dirigida ao cliente ou aos gestores de nvel superior da empresa, bastar uma
descrio ao nvel das macro-actividades. Mas para o responsvel da execuo do projecto
importante ter uma descrio pormenorizada que o ajude a orientar e controlar a execuo
do projecto. Uma ideia interessante elaborar uma hierarquia de redes para o mesmo
projecto. Ou seja, construir vrias redes em que o grau de pormenor vai aumentando.
No nvel superior da hierarquia o projecto decomposto apenas nos grandes processos ou
macro-actividades, mas nos nveis seguintes essas actividades vo sendo progressivamente
decompostas.
Captulo 5
79
Um aspecto que importante que, seja qual for o nvel de pormenor a que a rede
construda, deve manter-se o mesmo nvel de detalhe em todas as actividades. Por exemplo,
no faria sentido estar a descrever a construo de uma casa, a um nvel muito geral
(fundaes, estrutura do primeiro andar, estrutura da cobertura,...) e simultneamente
incluir uma actividade como a montagem de uma porta ou de uma janela.
5.2.2
5.3
A programao do projecto comea pela denio clara do projecto, identicando as actividades que o constituem, as interdependncias entre elas, o tempo de durao e os recursos
necessrios para a sua execuo. O passo seguinte proceder a anlises que permitam
denir o programa de realizao do projecto. H vrios mtodos que tm sido utilizados
80
Mtodos Quantitativos
para este efeito. A escolha entre eles depender do problema concreto em anlise, da sua
maior ou menor complexidade, dos objectivos que se pretendem atingir e das restries a
levar em considerao.
Vamos comear por estudar uma tcnica relativamente simples: o diagrama de Gantt.
Esta tcnica fcil de usar e compreender, e prefeitamente adequada para projectos
relativamente simples, mas tem grandes limitaes quando a complexidade aumenta.
Em contrapartida, os mtodos baseados em redes de actividades tm capacidade para
resolver problemas de planeamento mais complexos. Estudaremos dois mtodos: o mtodo
do caminho critco (na terminologia inglesa Critical Path Method ou CPM ) e a tcnica de
elaborao e controlo de projectos (em ingls Program Evaluation and Review Technique
ou PERT ). Estes dois mtodos diferem no tratamento da incerteza da durao das tarefas.
No CPM admite-se que a durao das tarefas determnista, no PERT a durao de cada
actividade estocstica.
Em todos os mtodos teremos a preocupao de falar da sua utilizao para efeitos de
planeamento, mas tambm da sua utilizao na monitorizao do projecto.
5.3.1
Diagrama de Gantt
Captulo 5
81
designado por escalonamento das datas mais cedo. Este no o nico mtodo de escalonamento possvel. Uma alternativa iniciar as actividades o mais tarde possvel, tendo em
conta que o projecto deve estar concludo numa determinada data. A Figura 5.4 ilustra,
para o exemplo anterior, o escalonamento das datas mais tarde, admitindo que o projecto
tem de estar concludo ao m de 8 dias. Neste caso, comeamos por representar as actividades que no tm nenhuma actividade subsequente o mais tarde possvel (a tarefa E,
no nosso exemplo). De seguida, representamos o mais tarde possvel as actividades que
so imediatamente precedentes das actividades j representadas (as actividades D e B no
exemplo), e assim sucessivamente at estarem representadas todas actividades, incluindo
as que no tm tarefas precedentes.
O diagrama de Gantt pode ser utilizado no controlo do projecto medida que este vai
sendo implementado. A ideia indicar no diagrama o progresso em cada um das actividades sombreando uma fraco da barra representativa de cada actividade. Imaginemos,
82
Mtodos Quantitativos
Com base nesta representao podemos concluir que a actividade B est adiantada
um dia em relao ao planeado e que, em contrapartida, a actividade C est atrasada
um dia em relao ao planeado. Repare-se que isto no pe ainda em causa a concluso
do projecto em 8 dias, mas agora as actividades crticas so C, D e E.
Este pequeno exemplo ilustra o facto de os diagramas de Gantt no serem apenas
instrumentos de planeamento esttico, mas deverem ser tambm utilizadas na fase de
execuo do projecto. Esta utilizao dinmica dos diagramas de Gantt permite observar
a evoluo de cada uma das actividades, identicar eventuais problemas, e tomar medidas
para corrigir esses problemas.
Em projectos simples os diagramas de Gantt so muito utilizados porque so fceis de
usar e de compreender. Mas em projectos complexos os diagramas de Gantt so inadequados porque no ilustram de forma clara as relaes entre as vrias actividades. Para
projectos complexos dcil construir os diagramas de Gantt na fase de planeamento e
ainda mais dcil proceder a alteraes caso haja mudanas no planeamento. Para esses
casos, os mtodos baseados em redes de actividades so claramente superiores.
Captulo 5
5.3.2
83
O mtodo do caminho crtico (CPM Critical Path Method) foi inicialmente concebido
para o planeamento de projectos com objectivo de minimizar o tempo de realizao do
projecto. Contudo, possvel incorporar na anlise o planeamento dos recursos necessrios
e de estudar os trade-os existentes entre custo e tempo de realizao. Vamos comear por
estudar o problema de programao temporal e, mais tarde, estender a anlise gesto
dos recursos.
Elaborao da rede de actividades
Para ilustrar a aplicao do mtodo do caminho crtico vamos considerar um exemplo
simples. Uma equipa de engenheiros responsvel por pr a funcionar uma linha de
produo para manufacturar um novo produto numa determinada empresa. As mquinas
j chegaram dos fornecedores, e a fbrica j foi redesenhada de forma a que a linha de
produo possa ser montada. Pretende-se que a fbrica esteja pronta a produzir no espao
de um ms. A equipa deste projecto identicou as vrias actividades envolvidas, as relaes
de precedncia entre as actividades e ainda os tempos de durao de cada actividade. A
tabela seguinte apresenta a informao relevante.
Actividade
Cdigo
Durao da
actividade
Cdigo actividades
imediatamente
precedentes
Ligar as mquinas
Treinar p essoal
D,E
Pintar e limpar
F,G
H,I
84
Mtodos Quantitativos
Na elaborao da rede muito til construir um quadro auxiliar onde se indicam todas
as actividades e as respectivas actividades precedentes. medida que as actividades vo
sendo representadas na rede, os seus cdigos vo sendo riscados na lista de precedncias.
As actividades que se podem iniciar-se a cada passo so aquelas para os quais a lista de
precedncia j tem os cdigos todos riscados (o que signica que as actividades precedentes
j esto todas representadas). A tabela seguinte apresenta esta ideia depois de A, B e
C j estarem marcadas. fcil vericar que, no passo seguinte, D, E e G podem ser
representadas na rede e os respectivos cdigos riscados nas listas de precedncias.
Captulo 5
Cdigo
85
D,E
F,G
H,I
Um aspecto curioso na rede do projecto de montagem da linha de produo a existncia de uma actividade marcada a tracejado, unindo os ns 6 a 5. Esta actividade no
demora tempo, nem consome recursos, uma actividade ctcia. O facto de se introduzir
esta actividade ctcia prende-se com a necessidade de a rede representar de forma correcta as interdependncias entre as actividades. Se no tivessemos includo a actividade que
liga os ns 6 a 5, no estaramos a levar em considerao o facto de H s se poder iniciar
depois de E estar concluda. Repare-se que tambm no poderamos fazer coincidir os ns
5 e 6, porque se o zessemos estaramos a impr que F s pudesse ser iniciada depois de
D, o que viola as relaes de precedncia identicadas.
normal no traado inicial da rede introduzir mais actividades ctcias que as efectivamente necessrias. Mas, desde que a estrutura lgica da rede esteja correcta, isso no
levanta grandes problemas. A nica desvantagem que torna a rede mais complexa do que
seria necessrio, o que pode tornar a anlise mais morosa, mas permite chegar s mesmas
concluses da anlise da rede simplicada. Por conseguinte, depois de se ter produzido
uma representao inicial da rede de actividades, boa ideia vericar se ou no possvel
simplicar o traado da rede.
Identicao das actividades crticas
Vamos comear por identicar para cada n da rede qual o seu tempo mais cedo de
ocorrncia, isto , qual tempo mnimo que ter de decorrer desde o incio do projecto
at que todas as actividades que convergem naquele n estejam concludas. Por exemplo,
o tempo mais cedo do n 2 de 5 dias (para se atingir o n dois necessrio efectuar a
86
Mtodos Quantitativos
actividade A que demora 5 dias). Depois de j ter executado a actividade A, para se atingir
o n 3 necessrio efectuar a actividade B, o que demora mais 7 dias. Por conseguinte,
o tempo mnimo necessrio para atingir o n 3 de 5 + 7 = 12 dias. Se designarmos por
TMCi o tempo mais cedo do n i e por di;j a durao da actividade que liga os ns i e j,
teramos neste exemplo:
TMC3 = TMC2 + d2;3 = TMC2 + dB = 5 + 7 = 12.
De forma semelhante, o tempo mais cedo do n 4 :
T MC4 = TMC2 + d2;4 = T MC2 + dC = 5 + 4 = 9.
E por sua vez o TMC6 = 9 + 9 = 18.
A ocorrncia de alguns ns est dependente da concluso de mais do que uma actividade. Por exemplo, a ocorrncia do n 5 est condicionada pela concluso da actividade
D e da actividade ctcia. Para esses ns o tempo mais cedo determinado pela ltima
actividade a ser concluda, no conjunto de actividades que convergem naquele n. O tempo
mais cedo de concluso da actividade D 12+3 = 15 dias. Mas a concluso da actividade
ctcia no pode ocorrer antes de 18 dias e, por conseguinte, o tempo mnimo necessrioa
para atingir o n 5 so 18 dias. Ou seja:
TMC5 = max [T MC3 + 3; TMC6 + 0] = max [15; 18] = 18:
Este exemplo pode ser generalizado. Se o n j tem como ns precedentes (isto ns
ligados directamente ao n j por arcos orientados) vrios ns i, ento o tempo mais cedo
do n j dado por:
T MCj = max [TMCi + di;j ] :
i
Captulo 5
87
nos 32 dias, isto , qual o tempo mais tarde de ocorrncia do n. Designemos por TMTj o
tempo mais tarde de ocorrncia do n j. Para o n 9, que ltimo n da rede e corresponde
concluso do projecto, o tempo mais tarde de ocorrncia 32 dias, se quisermos garantir
que o projecto est concludo ao m de 32 dias. Como determinar o tempo mais tarde de
ocorrncia dos outros ns da rede? Vamos ter de proceder recursivamente do m para o
incio da rede.
Ns sabemos que depois de o n 8 ter ocorrido ainda falta realizar a actividade I para
concluir o projecto. Como esta actividade tem uma durao de 4 dias, isso implica que
para que a durao total do projecto seja de 32 dias, o tempo mais tarde de ocorrncia do
n 8 de 28 dias, ou seja:
T MT8 = TMT9 d8;9 = TMT9 dI = 32 4 = 28:
De forma semelhante, o tempo mais tarde de ocorrncia dos ns 5 e 7 dado por:
T MT5 = TMT8 d5;8 = TMT8 dH = 28 3 = 25:
T MT7 = TMT8 d7;8 = TMT8 dI = 28 5 = 23:
At aqui os ns analisados s tinham um n subsequente. Mas o n 6 tem dois ns
subsequentes: o n 7 e o n 5. Por conseguinte, na determinao do tempo mais tarde de
ocorrncia do n 6 teremos de levar em conta os tempos mais tarde de ocorrncia desses
ns, no podendo a ocorrncia do n 6 por em causa nenhum desses tempos mais tarde.
Atendendo a que T MT5 = 25, e que a actividade que liga os ns 5 e 6 ctcia e logo
de durao nula, o n 6 no pode ocorrer mais tarde que ao m de 25 dias. Mas, temos
tambm que levar em conta o facto de T MT7 = 23, e como a durao da actividade F
de 5 dias, isso implica que o tempo mais tarde de incio da actividade F de 18 dias.
Esta condio a mais restritiva e, por conseguinte, o tempo mais tarde de ocorrncia do
n 6 de 18 dias. Em termos formais:
TMT6 = min [TMT5 d6;5; TMT7 d6;7] = min [25 0; 23 5] = 18:
Este exemplo do clculo do tempo mais tarde do n 6, pode generalizar-se para qualquer
n i, que precede um conjunto de ns, identicados pelo ndice j. O tempo mais tarde de
ocorrncia do n i dado por:
TMTi = min [TMTj di;j ] :
j
88
Mtodos Quantitativos
A anlise dos tempos mais cedo e mais tarde para cada n da rede permite-nos identicar duas situaes: para alguns ns o tempo mais cedo e o tempo mais tarde no
coincidem, para outros ns aquelas datas coincidem. Consideremos o n 5, por exemplo.
O facto de TMC5 = 18, indica-nos que so necessrios 18 dias para concluir todas as
actividades que antecedem o n 5, no sendo por isso possvel iniciar a actividade H antes
desta data. Por outro lado, o facto de TMT5 = 25 indica-nos que para no por em causa
a concluso do projecto em 32 dias a actividade H no pode ser iniciada mais tarde que
ao m de 25 dias, implicando que todas as actividades que precedem a actividade H tero
de estar concludas at aquela data. Para o n 5 existe alguma exibilidade, o seu tempo
de ocorrncia pode variar entre 18 e 25, sem que isso viole as condies do problema.
Captulo 5
89
90
Mtodos Quantitativos
Captulo 5
91
Figura 5.8: Tempo mais cedo e mais tarde de incio e de concluso de cada actividade.
92
Mtodos Quantitativos
De forma semelhante, podemos denir a folga livre esquerda como o aumento que
pode ocorrer na durao da tarefa sem que isso condicione as datas de concluso das
actividades antecessoras, e dada por:
FLEi;j = T MTj TMTi di;j :
Por ltimo, podemos denir a folga independente como o aumento que pode ocorrer
na durao da actividade sem que isso condicione em nada nem as datas de incio das
actividades sucessoras, nem as datas de concluso das actividades antecessoras. A folga
independente calculada admitindo que as actividades antecessoras so concludas no
tempo mais tarde e que as actividades sucessoras se iniciam no seu tempo mais cedo, ou
seja:
F Ii;j = T MCj T MTi di;j :
importante realar que a folga independente pode ter valores negativos. Um valor
negativo da folga independente signica que seria necessrio uma reduo na durao da
actividade para em simultneo poder iniciar as actividades sucessoras no seu tempo mais
cedo e poder concluir as actividades antecessoras no seu tempo mais tarde. Ou seja,
impossvel satisfazer em simultneo aquelas duas condies a no ser que se reduza a
durao da actividade.
Os quatro tipos de folgas esto relacionados. fcil mostrar que:
F LDi;j + F LEi;j = FTi;j + FIi;j :
O quadro seguinte apresenta os quatro tipo de folgas para as actividades no crticas no
exemplo do projecto de montagem da linha de produo.
5.3.3
Actividade
FT
FI
FLD
FLE
10
10
10
-7
O PERT foi desenvolvido em meados da dcada de 1950, tendo sido utilizado na programao do projecto de construo do submarino Polaris (diz-se que a sua utilizao
Captulo 5
93
possibilitou que o projecto fosse concludo 2 anos antes do que seria possvel caso no
tivesse sido utilizado).
No mtodo do caminho crtico admite-se que a durao de uma actividade determnistica, isto , no h qualquer incerteza relativamente ao seu valor. Mas na realidade
h sempre alguma incerteza sobre a durao de uma actividade. O PERT (Program Evaluation and Review Technique) um mtodo de programao e controlo de projectos que
leva em considerao a incerteza associada durao de cada actividade. No PERT a
durao de uma actividade considerada uma varivel aleatria. Tal como o mtodo
do caminho crtico, o PERT usa a representao em rede. Contudo, no PERT a rede
estocstica e permite uma anlise probabilstica da durao global do projecto.
Na sua verso original, o PERT exige trs estimativas da durao de cada actividade:
uma estimativa optimista dop (condies muito favorveis), uma estimativa pessimista dpe
(condies adversas), e a estimativa mais provvel dmp (condies normais). Para alm
disso, o PERT admite que a durao da actividade segue uma distribuio beta. Nestas
condies, a durao mdia dada por:
dop + 4dmp + dpe
:
6
Por sua vez, a disperso dos valores da durao em relao ao seu valor mdio, medida
pela varincia, dada por:
E [d] = =
(dpe dop)2
:
36
A varincia da durao uma medida do grau de incerteza associado durao.
A razo para a escolha da distribuio beta prende-se com a sua exibilidade, podendo
ter assimetria positiva ou negativa, consoante os valores das estimativas dop, dmp e dpe .
de salientar que em termos conceptuais no h razo para no se optar por outras
distribuies. Alis, se no passado tiverem sido realizados muitos projectos semelhantes
ao projecto em causa, a informao sobre a durao de cada actividade nos projectos
passados pode ser utilizada para testar qual a distribuio que melhor se ajusta aquelas
observaes. O problema que para projectos que tenham poucos projectos similares no
possvel testar se a distribuio terica admitida se ajusta ou no aos dados (porque
estes no existem!).
Se a durao de cada actividade estocstica, a durao total do projecto tambm
estocstica. Qual a funa de distribuio da durao global do projecto?
Vamos comear por analisar um caso simples: todas as actividades do projecto so
realizadas em sequncia: primeiro feita a actividade 1, depois a 2, depois a 3, , at
2 =
94
Mtodos Quantitativos
actividade n. Neste caso, a durao total do projecto igual soma das duraes das
suas actividades:
dT = d1 + d2 + + dn;
em que cada uma das duraes, di ; uma varivel aleatria. Como a mdia da soma de
variveis aleatrias igual soma das mdias das variveis aleatrias, a durao mdia
do projecto dada por:
T = 1 + 2 + + n :
Para alm disso, se admitirmos que as duraes das vrias actividades so independentes,
a varincia da durao total do projecto igual soma das varincias da durao das
vrias actividades:
2T = 21 + 22 + + 2n :
claro que o conhecimento do valor esperado e da varincia da durao total do
projecto so importantes, mas no chegam para identicar a funo de distribuio de dT .
No PERT admite-se que dT segue uma distribuio normal. Esta hiptese justicada se o
nmero de actividades for elevado. De facto, pelo teorema do limite central a distribuio
da soma de variveis aleatrias tende para uma distribuio normal, se o nmero de
parcelas for sucientemente elevado.
O caso anterior pouco realista. Na maior parte dos projectos h vrias sequncias de
actividades, que podem ser realizadas em paralelo. H vrios caminhos que necessrio
percorrer para que o projecto seja realizado e a durao do projecto determinada pela
sequncia que demorar mais tempo a realizar. Como calcular a distribuio da durao
nestas circunstncias?
Em termos tericos a anlise extremamente complexa, porque as duraes dos vrios
caminhos no so independentes (muitos caminhos tm troos que so comuns). Por essa
razo, comum simplicar a anlise admitindo que a durao do projecto denida pela
durao do caminho crtico considerando as duraes mdias de cada actividade. A anlise
probabilstica do tempo de durao total do projecto feita assumindo que a durao
total segue uma distribuio normal, em que a mdia igual durao total esperada do
caminho crtico e a varincia igual soma das varincias da durao das actividades no
caminho crtico.
Mais frente veremos que basear a anlise estatstica do projecto exclusivamente nas
propriedades do caminho crtico considerando as duraes mdias pode ser pouco realista,
Captulo 5
95
sobretudo naqueles casos em que existem caminhos subcrticos com duraes esperadas
prximas da durao esperada do caminho crtico e com varincia relativamente elevadas.
Antes disso, vamos ver uma pequeno exemplo de aplicao do mtodo PERT.
A tabela seguinte apresenta as actividades necessrias para completar um dado projecto, as respectivas relaes de precedncia e ainda trs estimativas da durao de cada
uma das actividades. Para alm disso, a tabela tambm j apresenta a mdia e a varincia
da durao cada actividade.
Actividade
Actividades
precedentes
dop
dmp
dpe
12
14
16
14.00
0.44
6.83
0.25
14
19
30
20.00
7.11
12
8.00
1.78
3.00
0.11
C,E
20
22
26
22.33
1.00
10
15
20
15.00
2.78
96
Mtodos Quantitativos
O caminho crtico constitudo pelas actividades A; C e F , sendo a sua durao esperada igual a 56.33 dias. De acordo com as hipteses simplicadoras do PERT, a durao
mdia do projecto dada por:
T
= A + C + F =
= 14 + 20 + 22:33 = 56:33
= 2A + 2C + 2F =
= 0:44 + 7:11 + 1:00 = 8:55:
E admitindo que a durao total segue uma distribuio normal (contudo, neste exemplo difcil justicar esta hiptese, porqu?) podemos agora fazer anlises de carcter
probabilstico. Por exemplo, qual a probabilidade de o projecto demorar mais de 60
dias? E qual a probabilidade de demorar menos de 50 dias.
Note-se que como dT segue uma distribuio normal com mdia T e varincia 2T a
d
varivel z = TT T segue uma normal estandartizada:
dT N(T ; 2T ) ) z =
dT T
N(0; 1):
T
Por conseguinte:
a T
P(dT > a) = P z >
;
T
o que nos permite recorrer tabela da normal para responder s perguntas feitas anteriormente.
A probabilidade de o projecto demorar mais de 60 dias igual a:
60 56:33
P(dT > 60) = P z > p
= P (z > 1:2551) = 0:1047
8:55
ou seja, aproximadamente 10,5%. E a probabilidade do projecto demorar menos de 50
dias:
50 56:33
P(dT < 50) = P z < p
= P(z < 2:1648) = 0:0152;
8:55
ou seja, apenas 1.52%.
Captulo 5
97
Repare-se que, neste caso, os caminhos subcrticas tm duraes mdias muito inferiores do caminho crtico, sendo pouco provvel que algum deles venha a ser o caminho
com durao mais longa. Mas isto nem sempre acontece! O problema que sendo a
durao estocstica, pode haver vrios caminhos que, com alguma probabilidade, so os
caminhos de durao mais longa.
Para ilustrar esta ideia suponhamos que as estimativas da durao da actividade E em
vez de serem as apresentadas na tabela, eram: dop = 16, dmp = 18 e dpe = 25, o que implica
E = 18:83 e 2E = 2:25. Considerando a durao mdia de cada actividade o caminho
crtico continua a ser (A; C; F ). Contudo bastante provvel que o caminho crtico venha
a ser (B; D; E; F ). De facto, se compararmos estes dois caminhos nos troos que no so
comuns (do n 1 ao n 5), vericamos que as suas duraes mdias so extremamente
prximas:
A + C = 14 + 20 = 34
Para alm disso a varincia do primeiro caminho 7.55 e a do segundo 4.28. Nestas
condies ambos os caminhos tm alguma probabilidade de virem a ser o caminho mais
longo. Para vermos isto basta pensarmos que possvel, por exemplo, a durao do
primeiro caminho ser inferior a 34 e, simultaneamente, a durao do segundo caminho ser
superior a 34. Admitindo, como at aqui que a distribuio da durao total tem uma
distribuio normal, a probabilidade de isto acontecer (como os estes dois caminhos no
tm troos comuns natural admitir que as suas duraes so independentes, facto que
usado nos clculos que se seguem):
P [(dA + dC 34) ^ (dB + dC + dE > 34)] = P [dA + dC 34] P [dB + dC + dE > 34]
34 33:66
p
= 0:5 P z >
4:28
= 0:5 0:4347 = 0:21735:
Este exemplo mostra que fazer a anlise probabilstica s com base no caminho crtico para as duraes mdias pode ser enganador. Quando a durao das actividades
aleatria, cada actividade tem uma determinada probabilidade de estar no caminho crtico, algumas delas podem ter uma probabilidade prxima de 1, outras prximas de 0. Para
alm disso, o caminho crtico tambm aleatrio.
Uma forma de estimar de forma mais precisa a distribuio da durao total do projecto
e de determinar qual a probabilidade de cada uma das actividades pertencer ao caminho
crtico consiste em fazer um nmero elevado de simulaes da rede de actividades. Em cada
98
Mtodos Quantitativos
5.3.4
Para se conhecer a relao entre custo e durao para um projecto concreto, o que se
costuma fazer calcular os custos associados durao normal, e os custos associados
a outras duraes escolhidas. Por exemplo, calculam-se os custos associados a uma durao de 80 dias, de 75 dias e de 85 dias. Ficamos assim com trs pontos no espao da
Captulo 5
99
durao custo. Admitindo que entre estas duraes a relao linear, obtemos assim uma
aproximao curva de custos.
Vejamos um pequeno exemplo para ilustrar o trade-o entre custo e durao. Consideremos o projecto da Figura 5.11, onde esto indicadas as duraes normais de cada
actividade. A durao total do projecto de 8 dias.
Suponha-se que se pretende reduzir a durao do projecto para 7 dias com um custo
adicional mnimo. Na tabela seguinte esto indicadas as duraes e custos alternativos
para cada actividade.
durao
custo
durao
custo com
normal
normal
reduzida
dur. reduz.
20
0.5
40
75
85
45
60
15
0.5
30
60
80
Actividade
100
Mtodos Quantitativos
Parte II
Mtodos Estatsticos
101
Captulo 6
6.1
Rendimento
500
Idade
45
Sexo
0
Anos de escol.
20
2
3
4
5
300
450
150
150
30
35
25
32
1
0
0
1
15
20
15
10
104
Mtodos Quantitativos
6.2
6.2.1
Frequncia Absoluta
1138
2748
2304
2082
Frequncia Relativa
0,118
0,285
0,239
0,216
5
6
Total
848
520
9640
0,088
0,054
1
Captulo 6
105
6.2.2
Variveis contnuas
106
Mtodos Quantitativos
) normal considerar classes com amplitude constante. Mas, pode haver casos
em que esse procedimento no adequado.
contagem dos valores pertencentes a cada classe
) note-se que ao agruparmos em classes h sempre perda de informao, porque
deixamos de observar a variabilidade dentro de cada classe.
Exemplo de uma situao em que no prtico considerar classes de igual amplitude.
O quadro a seguir apresenta dados das exploraoes agrcolas de Trs os Montes,
relativamente superfcie agrcola utilizvel:
Classes (ha)
0 < s < 0; 5
0; 5 s < 1; 5
1; 5 s < 2; 5
2; 5 s < 5
5 s < 10
10 s < 20
20 s < 50
50 s < 100
s 100
Total
Frequncias Absolutas
4391
8557
17104
22900
14684
8694
3467
497
163
80457
Frequncias Relativas
0; 0546
0; 1064
0; 2126
0; 2846
0; 1825
0; 1080
0; 0431
0; 0062
0; 0020
1
Captulo 6
Peso
760-780
780-800
800-820
Freq. Absol.
4
43
118
Freq. Relativa
0,008
0,086
0,236
820-840
840-860
860-880
880-890
168
117
39
11
0,336
0,234
0,078
0,022
107
Quando se passa dos dados originais para uma tabela de frequncias h sempre perda
de informao, uma vez que deixamos de considerar a variabilidade dentro de cada
classe.
Tal como zemos para as variveis discretas, tambm podemos denir a funo
cumulativa das frequncias relativas. F(x) indica-nos qual a frequncia relativa de
valores iguais ou inferiores a x. A funo F (x) tem as seguintes propriedades:
0 F (x) 1 com 1 < x < +1
F(x) uma funo no decrescente
F(1) = 0, F(+1) = 1
6.3
Representao grca
6.3.1
Variveis discretas
108
Mtodos Quantitativos
Node indivduos
1
2
3
4
5
6
Total
Freq.Absoluta
1138
2748
2304
Freq. Relativa
0; 118
0; 285
0; 239
Freq. Acumulada
0; 118
0; 403
0; 642
2082
848
520
9640
0; 216
0; 088
0; 054
1
0; 858
0; 946
1
) reparar que temos uma funo em escada, que varia entre 0 e 1, e que no
decrescente.
6.3.2
Variveis contnuas
fj
n
= fj ou Aj = hj j = nj
hj
hj
) Quando as classes tem todas igual amplitude normal fazer a altura do rectngulo
igual frequncia relativa ou absoluta.
) Se aumentarmos indenidamente o nmero de classes, tendendo a amplitude das
classes para zero, o histograma tende para uma curva contnua. A essa curva chamase curva de frequncias e representao grca da funo de frequncias.
Uma representao alternativa feita pelo polgono de frequncias que resulta de se
unirem por segmentos de recta os pontos mdios dos lados superiores dos rectngulos
A funo cumulativa de frequncias relativas tambm pode ser representada gracamente o polgono integral.
Captulo 7
7.1
Medidas de localizao
7.1.1
Mdia
A mdia muitas vezes usada como valor representativo de uma amostra. A mdia
o centro da distribuio. comum falar-se em rendimento mdio, mdia das
idades, nota mdia,...
A mdia de uma amostra constituda pelos n valores x1; x2; ; xn dene-se pela
expresso:
x=
x1 + x2 + + xn
n
) isto uma mdia ponderada, cada valor ponderado pela frequncia com que
ocorre.
Propriedades da mdia designemos por m(x1; x2; ; xn ) a funo mdia
Se adicionarmos um constante k a cada um dos valores da amostra, a mdia
tambm aumenta k.
m(x1 + k; x2 + k; ; xn + k) = m(x1 ; x2 ; ; xn) + k
110
Mtodos Quantitativos
n1x1 + n2x2 + + nk xk
n
Captulo 7
111
Taxa
%
1991
2
1992
3
1993
1
1994
4
1995
5
) o PIB de 1995 pode ser calculado uma vez conhecido o PIB de 1990 fazendo:
P IB1995 = P IB1990 (1 + 0; 02)(1 + 0; 03)(1 + 0; 01)(1 + 0; 04)(1 + 0; 05)
= 1; 1587P IB1990
) A questo : qual a taxa de crescimento anual mdia? Qual a taxa tal que
se o PIB crescer todos os anos aquela taxa obtemos o mesmo crescimento que o
vericado?
P IB1990 (1 + g)5 = 1; 1587PIB1990 , (1 + g)5 = 1; 1587 , g =
p
5
1:1587 1
n
Y
g=
(1 + gi)
7.1.2
i=1
#1
v
un
Y
u
n
1 = t
(1 + gi) 1
i=1
Mediana
112
Mtodos Quantitativos
No caso de dados classicados pode calcular-se a mediana usando a funo cumulativa. De facto, o valor da funo cumulativa igual a 12 se o argumento for a
mediana.
1
F(M) = freq. relativa de valores inferiores ou iguais a M = .
2
Exemplo do clculo da mediana com valores classicados
Peso
760-780
780-800
800-820
Freq. Relativa
0,008
0,086
0,236
820-840
840-860
860-880
880-890
333
450
489
500
0,336
0,234
0,078
0,022
0,666
0,900
0,978
1
7.1.3
Moda
Captulo 7
113
7.2
Medidas de disperso
7.2.1
114
Mtodos Quantitativos
) uma forma de fazer isto considerar o quadrado dos desvios (ao elevar ao quadrado
obtemos sempre nmero positivo)
) outra forma de fazer isto considerar o valor absoluto dos desvios.
A varincia a mdia dos desvios quadrados em relao mdia:
P
(xi x)2
2
s =
n
Se os dados forem classicados:
s =
nj (x0j x)2
n
No caso de amostras pequenas devem calcular-se a varincia e desvio-padro corrigidos. A frmula idntica excepto que se divide por n 1:
P
(xi x)2
2
s =
n1
Propriedades da varincia
s2 =
x2i
n
x2
P 2
P
2
2
x
2xx
+
x
(x
x)
i
i
i
s2 =
=
=
n P
P 2n
P
xi
2x xi nx2
x2i
=
+
=
x2
n
n
n
n
Se as n observaes de uma amostra estiverem repartidas em k subamostras,
as varincias das subamostras esto relacionadas pela expresso seguinte:
nj
k X
k
k
X
X
X
ns =
(xji x)2 =
nj s2j +
nj (xj x)2
2
j =1 i=1
j=1
j=1
Captulo 7
7.2.2
115
Desviomdio
O desvio mdio a mdia dos valores absolutos dos desvios em relao mdia:
Pn
jxi xj
d = i=1
n
Tanto o desvio padro como o desvio mdio so medidas sensveis existncia de
outliers.
7.2.3
Extremos-quartos e mediana
As estatsticas de ordem podem tambm ser utilizadas para avaliar a disperso. Uma
medida possvel a diferena entre os extremos (valor mximovalor mnimo). Mas
a diferena entre os extremos no uma medida resistente. prefervel usar a
disperso quartal que a diferena entre o terceiro e o primeiro quartil. Representa
a amplitude do intervalo onde se situam as observaes centrais (50%).
7.2.4
116
Mtodos Quantitativos
7.2.5
Freq. Abs.
4391
8557
17104
22900
14684
8694
3467
497
163
80457
rea Total
2646
10295
38366
108352
136584
150401
124220
41484
33930
6462781
rea acum.
0; 054575
0; 160930
0; 373516
0; 658140
0; 840647
0; 840647
0; 9487505
0; 991796
1
1
0; 0040904
0; 020023
0; 079388
0; 247043
0; 458383
0; 691101
0; 883310
0; 947499
1
1
Captulo 7
117
) fazendo (p0 ; q0) = (0; 0) e unindo por segmentos de recta os pontos (p i; qi ) obtemos
uma linha poligonal, que quando se consideram um nmero innito de pontos tende
para curva de Lorenz.
) se a distribuio for equitativa, temos que pi = qi e a curva de Lorenz a diagonal
do quadrado unitrio.
) quanto mais afastada estiver a curva de Lorenz da diagonal, maior a concentrao, maior a desigualdade na distribuio do atributo.
O ndice de concentrao de Gini baseado na ideia de que quanto maior for a rea
entre a curva de Lorenz e a diagonal, maior a concentrao. O ndice dado por:
Pk1
(pi qi)
G = i=1
Pk1
i=1 pi
) G = 0 se houver igual repartio
7.3
Assimetria
A ideia da simetria tem a ver com a forma como os valores se distribuem em torno
do centro, se se distribuem de forma simtrica ou no.
Nas distribuies simtricas a mdia, a mediana e a moda coincidem. Nas distribuies assimtricas a mdia puxada para o lado mais longo da distribuio.
) se a distribuio assimtrica positiva temos mdia > mediana > moda.
) se a distribuio assimtrica negativa temos mdia < mediana <moda.
) o grau de assimetria de Pearson baseado nesta ideia
g=
x mod
:
s
Uma outra medida de assimetria, proposta por Bowley baseada na ideia que em
distribuies simtricas os quartis esto a igual distncia da mediana, ou seja:
(Fu M) (M Fl ) = 0
118
Mtodos Quantitativos
(Fu M) (M Fl )
(Fu M) + (M Fl )
Captulo 8
Algumas distribuies
8.1
Distribuio normal
120
Mtodos Quantitativos
Em aplicaes prticas natural que as propriedades da normal no sejam exactamente vericadas: possvel que no haja perfeita simetria, possvel que a varivel
aleatria no varie num intervalo innito. Na prtica natural que a v.a. tome
valores que se situam no intervalo [ 3; + 3]
A funo densidade de probabilidade da distribuio normal dada por:
(x)2
1
f (x) = p
e 22 ,
2
Captulo 8
121
Algumas distribuies
) note-se que seria bastante trabalhoso ter que usar a expresso anterior para calcular a probabilidade de x tomar um valor num certo intervalo. Felizmente no
nessrio fazermos essas contas, como veremos j de seguida.
8.2
A normal estandartizada
x
1
= 4E [x] 5 = 0
| {z }
0
122
Mtodos Quantitativos
e
2z
"
#
2
(x
)
= E (z E(z))2 = E(z2) = E
2
i 2
1 h
2
=
E
(x
)
= 2 =1
2
19 15
=2
2
Captulo 8
123
Algumas distribuies
x
, x = + z
8.2.1
2
3
124
Mtodos Quantitativos
s3
Esta medida designa-se por skewness em ingls.Se a distribuio da varivel em
estudo for simtrica esta medida ser igual a zero. Se a varivel apresentar assimetria
positiva o que acontece que teremos desvios positivos com valores elevados, e
desvios negativos com valores menos elevados. Como ao elevarmos ao cubo o sinal
dos desvios se vai manter, o que acontece ao elevarmos ao cubo, que a soma dos
desvios positivos vai dominar a soma dos desvios negativos ao cubo, obtendo-se
um valor positivo para a medida de assimetria.
Como a normal no a nica distribuio simtrica, para vericarmos o ajustamento
normal temos de analisar tambm o achatamento da distribuio. O achatamento
est relacionado com o peso das abas. O achatamento, ou kurtosis, da distribuio
dado por:
Pn (xi x)4
i=1
s4
8.3
Distribuio do X 2
Se Z uma v.a. com distribuio N(0; 1), ento Z 2 uma v.a. com distribuio quiquadrado com 1 grau de liberdade:
Z 2 X 2(1):
Um resultado importante que a soma de variveis aleatrias independentes com distribuio qui-quadrado tambm segue uma distribuio qui-quadrado, em que os graus de
liberdade so iguais soma dos graus de liberdade.
Em termos mais formais: Sejam X1; X2; ; Xk variveis aleatrias X 2 (r1); X 2(r2 ); ; X 2 (rk ),
respectivamente. Se X1 ; X2; ; Xk forem independentes e Y = X1 + X2 + + Xk ento
Y X 2(r1 + r2 + + rk ):
Captulo 8
125
Algumas distribuies
de realar que uma varivel aleatria com distribuio qui-quadrado, s pode tomar
valores maiores ou iguais a zero. Para alm disso, a distribuio qui-quadrado depende
apenas dos graus de liberdade. Quanto mais elevado for o nmero de graus de liberdade,
menos assimtrica a distribuio.
8.4
A distribuio t
126
Mtodos Quantitativos
para o estimar. Essa incerteza sobre o valor de faz com a t seja mais varivel do
que z.
Converge para N (0; 1) quando o nmero de graus de liberdade aumenta. Mostrar
grco comparando para diferentes valores de n.
f.d.p. funo s dos graus de liberdade. Mostrar tabela.
Exemplo 8.1 Seja T uma varivel com distribuio t com 7 graus de liberdade ento:
P(t 1:415) = 0:9
8.5
A distribuio F
U
r1
V
r2
tem uma distribuio F com r1 e r2 graus de liberdade. A Figura 8.3 apresenta a funo
distribuio F com (10; 6) graus de liberadade.
Observaes:
f.d.p. funo s de r1 e r2. Mostrar tabela.
Mostrar grcos da F
Captulo 9
Amostragem e estimao
9.1
Populao e amostra
128
Mtodos Quantitativos
9.2
Pn
i=1 Xi
2
i=1 Xi X
X=
e S =
n
n1
so estatsticas.
Em termos de notao usaremos sempre letras maisclas para designar as estatsticas
e letras minsculas para nos referirmos a valores particulares dessas estatsticas. Por
exemplo, X e S2 designam as variveis aleatrias mdia na amostra e desvio-padro na
amostra, enquanto que x e s2 se referem a valores que essas variveis aleatrias tomam
para uma amostra em particular.
Captulo 9
129
Amostragem e estimao
O que distribuio por amostragem de uma estatstica? a distribuio de probabilidades dos valores que essa estatstica poderia tomar para todas as amostras de tamanho
n que possvel escolher da populao.
Exemplo 9.3 Seis empregados, varivel de interesse anos de experincia
2 4
8 ) = 5:5
Suponha-se que escolhemos aleatoriamente um grupo de 5 trabalhadores. Qual a distribuio de X? Admitindo que a amostragem feita sem reposio, h seis amostras
possveis com 5 elementos
Amostra Media
4; 6; 6; 7; 8
2; 6; 6; 7; 8
2; 4; 6; 7; 8
2; 4; 6; 7; 8
2; 4; 6; 6; 8
2; 4; 6; 6; 7
na Amostra
6:2
5:8
5:4
5:4
5:2
5:0
x1; x2
19
x 1; x 3
20
x1 ; x4
21
x2; x3
21
x 2; x 4
22
x3 ; x4
23
130
9.2.1
Mtodos Quantitativos
Suponhamos que a populao tem mdia e varincia 2. O que podemos dizer sobre a
distribuio amostral de X?
A mdia da distribuio amostral de X igual mdia da populao:
E(X ) =
A varincia da distribuio amostral de X igual a:
2X =
2
n
2
):
n
Captulo 9
Amostragem e estimao
131
Figura 9.1: Distribuio de X para duas amostras de dimenso diferente (n2 > n1 ).
N n
2
X =
, X = p
n N1
n N 1
onde N a dimenso da populao e n a dimenso da amostra.
Normalmente, se n < 0:05N (a dimenso da amostra inferior a 5% da dimenso da
populao) no se usa o factor de correo.
Repare-se que o factor de correo sempre inferior a 1. Logo, o desvio padro
corrigido da mdia na amostra inferior. Isto est de acordo com a intuio porque
estamos a considerar casos em que a amostra uma fraco relativamente elevada da
populao.
9.2.2
Vamos supor que estamos interessados em estimar a diferena na mdia de uma determinada varivel para duas populaes diferentes (por exemplo: homens versus mulheres,
portugueses versus americanos,...).
Seja n1 a dimenso da amostra retirada da primeira populao e n2 a dimenso da
amostra retirada da segunda populao. Sejam 1 e 2 as mdias em cada uma das
populaes e 21, 22 as respectivas varincias. A distribuio amostral da diferena das
mdias tem as seguintes propriedades:
E(X 1 X 2) = 1 2
var(X 1 X 2) =
21
n1
+ n22
132
Mtodos Quantitativos
9.2.3
Distribuio da proporo
9.2.4
p(1p)
n
Distribuio de
(n1)S2
2
9.3
Estimao
Nesta seco vamos abordar a questo de fazer inferncias sobre a populao quando
temos informao para uma amostra dessa populao. Muitas das vezes a distribuio da
populao depende s de alguns parmetros (por exemplo: se soubermos que a distribuio
normal basta saber mdia e varincia) ou ento ns estamos interessados s em certos
parmetros. A questo : ser que podemos inferir algo sobre o valor desses parmetros
de interesse com base na informao da amostra? O nosso objectivo arranjar uma forma
de estimar o valor do parmetro.
Captulo 9
133
Amostragem e estimao
9.3.1
O que que esta propriedade nos diz? preciso no esquecer que b uma varivel
aleatria. O valor de b
depende de qual a amostra que recolhida. O que a propriedade
nos diz que se ns repetssemos o processo de amostragem muitas vezes a mdia das
estimativas obtidas igual ao valor do parmetro na populao. A Figura 9.2 ilustra
gracamente o que signica um estimador ser no enviesado.
Vejamos alguns exemplos:
X um estimador no enviesado de
" n
#
" n
#
n
X Xi
X
1
1X
1
E(X ) = E
= E
Xi =
E(X i) = [n] =
n
n
n i=1
n
i=1
i=1
S 2 um estimador no enviesado de 2
" n
#
" n
#
" n
#
X (Xi X)2
X
X
2
1
1
2
2
E(S ) = E
=
E
(Xi X) =
E
Xi + X
n
1
n
1
n
1
i=1
i=1
i=1
134
Mtodos Quantitativos
b
Figura 9.2: (a) b
um estimador no enviesado de . (b) b
um estimador enviesado de :
o que equivalente a
mas isto
" n
#
X
1
=
E
(Xi )2 + ( X )2 2(Xi )(X )
n1
i=1
" n
#
n
X
X
1
E
(Xi )2 + n( X)2 2(X )
(X i )
n1
i=1
i=1
ou seja
" n
#
X
1
1 2
2
2
E
(Xi ) n( X) =
n n2=n = 2
n1
n 1
i=1
Captulo 9
135
Amostragem e estimao
Ou seja, se o estimador for consistente, quando n tende para innito o estimador converge
(em probabilidade) para o verdadeiro valor do parmetro. Ou ainda, possvel aproximar, tanto quanto desejarmos, o estimador do verdadeiro valor do parmetro desde que a
amostra seja sucientemente grande.
Um estimador pode ser enviesado mas ser consistente. Este facto ilustrado na Figura
9.4, onde esto representadas as funes densidade do estimador com amostras de dimenso diferentes (n3 > n2 > n1 ). O estimador b
um estimador enviesado de (isto
particularmente visvel para amostras de pequena dimenso). Contudo, medida que a
dimenso da amostra aumenta a funo densidade concentra-se cada vez mais em torno
do valor do parmetro. Repare-se que medida que n se torna maior o enviesamento do
estimador ca cada vez mais pequeno e tende para zero quando n tende para innito.
Exemplo 9.5 o estimador
Pn
i=1 (x i
um estimador enviesado de
x)2
136
Ecincia
Mtodos Quantitativos
Podem existir muitos estimadores no enviesados. Como escolher entre eles? natural
escolher o estimador cuja f.d.p. est mais concentrada em relao ao valor do parmetro da
populao. Ou seja aquele que tem menor disperso em torno da mdia. Se ns tivermos
dois estimadores no enviesados de , b
1 e b
2 ; baseados em amostras de igual dimenso,
b
ento dizemos que o estimador 1 mais eciente se
Var(b
1 ) < Var(b
2 )
Var(b
2 )
Var(b
1 )
1:572=n
= 1:57:
2=n
Captulo 9
Amostragem e estimao
137
b
Figura 9.5: O estimador b
mais eciente que o estimador b.
Embora a propriedade de no enviesamento seja desejvel pode acontecer que nenhum dos
estimadores no enviesados seja muito preciso, pode acontecer que todos eles tenham uma
varincia elevada em torno de . possvel que haja estimadores desse parmetro que
tenham algum enviesamento mas que tenham menor varincia. Nestes casos no bvio
que o estimador no enviesado seja o mais apropriado. Esta ideia apresentada na Figura
9.6 onde esto representadas as funes densidade de dois estimadores de . O estimador
b
um estimador enviesado de , mas tem um varincia relativamente pequena. Em
b
contrapartida, o estimador b
um estimador no enviesado de , mas tem um varincia
relativamente elevada. Qual dos dois estimadores melhor?
b
Figura 9.6: O estimador b
tem um erro quadrado mdio inferior ao estimador b.
Um critrio que partida parece bastante lgico para decidir nestes casos escolher
o estimador que em mdia tem um menor erro quadrado (porqu quadrado?). O erro
138
Mtodos Quantitativos
EQM(b) = Var(b
) + Env2
Isto resulta de
2
2
2
b
b
b
b
b
b
b
b
b
E E() + E()
= E E() + E() + 2 E() E()
Isto sugere que se queremos minimizar EQM pode ser prefervel um estimador enviesado,
desde que a varincia desse estimador seja mais pequena e que mais que compense pelo
enviesamento (veja a Figura 9.6).
interessante notar que, se estivermos a considerar s estimadores no enviesados a
minimizao de EQM corresponde minimizao da varincia. Logo obteremos o estimador mais eciente.
9.3.2
e E(X 2) = 2 + 2
Captulo 9
139
Amostragem e estimao
Dada uma amostra de dimenso n os dois primeiros momentos na amostra so dados por:
n
m1 =
1X
xi
n
i=1
m2 =
1X 2
xi
n
i=1
Seja X1; X2; ; Xn uma amostra aleatria retirada de uma distribuio com funo densidade de probabilidade f (x; 1 ; 2 ; ; k) em que 1; 2; ; k so parmetros desconhecidos, com ( 1; 2; ; k ) 2 - (espao dos parmetros - conjunto de valares que os
parmetros podem tomar).
A funo densidade de probabilidade da amostra aleatria
L( 1; 2; ; k ) = f(x1 ; 1 ; 2 ; ; k )f (x2; 1; 2; ; k ) f (xk ; 1; 2; ; n)
quando interpretada como funo dos parmetros chamada a funo de verosimilhana.
Repare-se que a f.d.p. da amostra aleatria depende dos valores dos parmetros. Dada
uma amostra em particular aquilo que se pergunta : quais so os valores de 1 ; 2 ; ; k
que com maior probabilidade geraram esta amostra. Ou seja, queremos encontrar os
valores dos parmetros que maximizam o valor da f.d.p. da amostra.
Suponhamos que as funes u1(x1; x2; ; xn ); ; uk(x1 ; x2 ; ; xn) maximizam o
valor da funo de verosimilhana. Ento os estimadores de mxima verosimilhana so
8
>
>
>
>
<
>
>
>
>
:
b1 = u1(x1 ; x2 ; ; xn)
b2 = u2(x1 ; x2 ; ; xn)
..
.
b
k = uk (x1; x2; ; xn )
140
Mtodos Quantitativos
P
1 x1
1 x2
1 xn
1 i xi
L() =
e
e
e
= ne
Se tomarmos o logaritmo desta funo, como o logaritmo uma funo crescente a soluo
do problema de maximizao ser a mesma (e como isto envolve produtos, logaritmo ajuda
porque camos com somas)
Pn
xi
ln L() = n ln i=1
i=1
logo o estimador de mxima verosimilhana de a mdia na amostra.
9.3.3
Quando escolhemos uma amostra e calculamos o valor do estimador para essa amostra
obtemos uma estimativa. Uma estimativa simplesmente um dos muitos valores que o
estimador poderia tomar. Contudo, as nossas inferncias sobre o parmetro da populao
so baseadas nessa estimativa. Por exemplo, s observaes x1; x2; ; xn corresponde
a estimativa x. Se usarmos x como estimativa de estamos a fazer estimao pontual
(obtemos um certo valor que supostamente um bom palpite do valor de ). Mas, qual o
nosso grau de conana nessa estimativa? Por exemplo: se na sondagem sobre as eleies
presidenciais se obteve que 54% dos individuos da amostra pretende votar no partido A,
qual o grau de conana de que a verdadeira percentagem de votos esteja entre 51% e
57%? Este tipo de perguntas leva-nos a pensar em estimao por intervalos.
Um estimador por intervalos de um parmetro da populao uma regra para determinar um intervalo que com certa probabilidade contm o parmetro da populao em
que estamos interessados. Naturalmente, h um trade-o entre o grau de conana e o
Captulo 9
141
Amostragem e estimao
tamanho do intervalo. Quanto maior for o grau de conana (quanto mais certos ns
quisermos estar de que o verdadeiro valor do parmetro est no intervalo) maior ter de
ser o intervalo (menos precisa ser a nossa estimativa).
Para construirmos intervalos de conana devemos relembrar-nos (mais uma vez) que o
estimador uma varivel aleatria. A preciso do estimador depende da sua distribuio )
para construir intervalos de conana precisamos de conhecer a distribuio ) importncia
da distribuio por amostragem.
Vamos ver isto usando um exemplo. Consideremos uma populao normal em que
a mdia da populao desconhecida, mas 2 conhecido e que queremos estimar .
Consideremos o estimador X, sabemos que X tem distribuio N(; 2=n), ou ainda que
Z=
X
p N (0; 1)
= n
X
P z=2 p z=2 = 1
= n
claro que o valor critco z=2 depende de . Por exemplo: se 1 = 0:95, ento
z0:025 = 1:96, se 1 = 0:90, ento z0:05 = 1:645. Na Figura 9.7 est representada a
funo densidade da normal estandartizada e indicados os valores critcos necessrios para
os trs nveis de conana mais usados na prtica: 90%, 95% e 99%. Note-se que quanto
mais elevado for o nvel de conana desejado maior o valor critco.
Figura 9.7: Distribuio normal para determinar valor de z =2 necessrio para um nvel de
conana de (a) 90%, (b) 95% e (c) 99%.
142
Mtodos Quantitativos
p
p
P X z=2 = n X + z=2 = n = 1
X z=2 p
; X + z=2 p
n
n
p
O intervalo de conana centrado em x e obtm-se subtraindo e somando z=2= n.
A amplitude do intervalo depende de n, de e de :
Quanto maior for a variabilidade na populao, , maior a amplitude do
intervalo ) menos precisa a estimativa.
p
Quanto maior for n, menor = n e logo menor a amplitude do intervalo
correspondente a um dado nvel de conana ) mais precisa a estimativa.
Captulo 9
Amostragem e estimao
143
Figura 9.8: Intervalos de conana de 90% para a mdia na populao, considerando dez
amostras diferentes.
9.4
9.4.1
Quando estudamos distribuies por amostragem vimos que h dois casos em que utilizar
a normal como distribuio de X apropriado:
Se a populao for normal N(; 2) ) x N (; 2 =n)
Se a populao tem mdia e varincia 2, independentemente da sua distribuio,
quando a amostra grande a distribuio de X aproximadamente normal pelo
teorema do limite central.
Nestes casos se conhecermos 2 possvel construr intervalos de conana para ,
com base na estimativa da mdia na amostra. Isto precisamente aquilo que zemos
anteriormente quando introduzimos o conceito de intervalo de conana.
Resumindo: se tivermos uma amostra de dimenso n de uma populao com mdia e
varincia 2 , se 2 for conhecido e x for a mdia observada na amostra, ento o intervalo
144
Mtodos Quantitativos
x z=2 p
; x + z=2 p
n
n
Exemplo 9.9 Seja x a durao de uma lmpada de 60-watts comercializada por um
certo produtor. A experincia passada permite concluir que a distribuio da durao
de lmpadas normal com varincia 1269. Numa amostra aleatria de 27 lmpadas de
60-watts vericou-se que a durao mdia foi de 1478 horas. Construa um intervalo com
um nvel de conana de 95% para a durao mdia das lmpadas de 60-watts daquele
produtor.
O intervalo :
36
36
1478 1:96 p
; 1478 + 1:96 p
= [1464:42; 1491; 58]
27
27
9.4.2
Varincia desconhecida
X
P t =2 (n 1) p t=2(n 1) = 1
S= n
p
p
P X t=2 S= n X + t=2 S= n = 1
Logo intervalo aleatrio:
S
S
X t=2(n 1) p
; X + t=2 (n 1) p
n
n
Captulo 9
Amostragem e estimao
145
s
s
x t=2(n 1) p
; x + t=2 (n 1) p
:
n
n
Exemplo 9.10 Uma amostra aleatria de seis automveis com o mesmo modelo e ano foi
recolhida e o seu consumo mdio de gasolina registado: 6.0, 6.2, 5.9, 6.1, 6.2, 6.3. Construa
um intervalo de conana a um nvel de conana de 90% para o consumo mdio deste
modelo de automveis.
A mdia na amostra 6.12, o desvio padro na amostra 0.177, o valor de t5;0:5 = 2:015,
logo o intervalo de conana
0:177
0:177
6:12 2:015 p
; 6:12 + 2:015 p
= [5:9744; 6:2656]
6
6
9.5
Muitas vezes estamos interessados em comparar as mdias de duas populaes. Por exemplo, um produtor tem dois fornecedores diferentes e quer testar se h ou no diferena
na qualidade do produto fornecido por ambos os produtores.
9.5.1
Varincias conhecidas
Se as populaes de onde as amostras so retiradas forem independentes e tiverem distribuio normal, a diferena entre as mdias tem tambm distribuio normal, com mdia
x y e varincia 2x=nx + 2y =ny. Isto implica que:
q
q
9.5.2
Se as varincias no forem conhecidas temos que estim-las com base nas amostras. Se
as amostras forem grandes a distribuio normal ser uma boa aproximao para a distribuio de (x y). Isto signica que
q
2
2
(x y) z=2 sx=nx + sx=ny
um intervalo de 100(1 )% de conana de x y .
146
Mtodos Quantitativos
nx = 96
ny = 206
sx = 2:09
sy = 1:91
(2:09)2 (1:91)2
+
96
206
ou seja
:19 x y 1:11
como o valor zero est includo neste intervalo a evidncia na amostra contra a hiptese
de que as duas mdias so iguais no muito forte.
9.6
Pb p
b P)=n
b
P(1
Captulo 9
147
Amostragem e estimao
Logo, o intervalo
"
pb z=2
pb(1 pb)
; pb + z=2
n
pb(1 pb)
n
Exemplo 9.12 Numa certa campanha eleitoral um dos candidatos manda realizar uma
sondagem (aleatria) entre a populao com capacidade de voto. Os resultados foram
que em 351 eleitores 194 dizem favorecer o candidato. O candidato deve ou no sentir-se
conante que vai ganhar?
Soluo: A proporo de eleitores na amostra favorecendo o candidato pb = 194
351 =
0:553. Se construirmos um intervalo de conana de 95% obtemos
r
0:553 0:447
0:553 1:96
, [:501; 0:605]
351
como este intervalo est todo acima de 50% o candidato pode sentir-se relativamente
conante de que ganha. Mas, repare-se que se o nvel de conana for maior a amplitude
do intervalo ser maior e logo a possibilidade de ter menos de 50% dos votos existe.
9.7
9.7.1
Nesta seco vamos estudar intervalos de conncia para a varincia de uma populao
normal. Naturalmente este intervalo baseado na varincia da amostra
S2 =
n
X
(X i X)2
i=1
n1
(n 1)S 2
2
2
P Xn1;1=2
Xn1;=2 = 1 ,
2
"
#
(n 1)S 2
(n 1)S2
2
P
2
= 1
2
Xn1;=2
Xn1;=2
148
Mtodos Quantitativos
Exemplo 9.13 Um produtor est preocupado com a variabilidade nos nveis de impureza
contidos na matria-prima recebida de um fornecedor. Uma amostra aleatria de 15
encomendas mostrou um desvio padro de 2.36% no nvel de concentrao de impurezas.
Assuma que a populao normal. Encontre um intervalo de conana de 95% para a
varincia na populao.
2
2
O valor de X14;0:975
= 5:629 e X14;0:025
= 26:12 e 14(2:36)2 = 77:974 logo
77:974
77:974
2
, 2:99 2 13:85
26:12
5:629
9.7.2
S2X
2X
SY2
2Y
=F
2X
.
2Y
Captulo 9
9.8
149
Amostragem e estimao
Quo grande deve ser a amostra para estimar um parmetro com um certo nvel de preciso? A resposta a esta pergunta depende da variabilidade na populao. Por exemplo, se
quizermos estimar a mdia da populao e soubermos que a varincia na populao nula
basta n = 1 para estimar com exactido a mdia da populao. Mas, se a varincia na
populao for elevada e desejarmos estimar com bastante preciso a amostra necessria
ser elevada.
A dimenso da amostra depende tambm do nvel de preciso com que queremos
estimar o parmetro. Se quizermos obter uma estimativa mais precisa (isto , com menor
amplitude do intervalo de conana) teremos que ter uma amostra mais elevada.
Se a varincia da amostra for conhecida fcil calcular qual a dimenso da amostra
que nos garante uma dada amplitude do intervalo de conana. De facto, ns sabemos
que
x z=2 p
; x + z=2 p
n
n
o intervalo de 100 (1 ) % nvel conana da mdia da populao. Este intervalo est
centrado na mdia observada na amostra e expande-se z=2 pn para cada um dos lados.
Suponha-se que queremos garantir que
z=2 p L
n
Isso implica que
n
=2 2
L
Como seria de esperar, quanto menor for a amplitude do intervalo que desejamos maior
ter que ser n (maior preciso ) maior n). Para alm disso, quanto maior for a varincia
na populao, maior ter que ser n.
Um outro caso com interesse o da propores. Vimos atrs que o intervalo de conana para a proporo centrado na proporo na amostra e extende-se
r
pb(1 pb)
z=2
n
para cada lado. O problema aqui que no possvel saber a amplitude do intervalo
sem primeiro estimar a proporo na amostra. Contudo, possvel escolher n de forma
150
Mtodos Quantitativos
a garantir que a amplitude no ultrapassa um certo valor. Basta notar que o valor mais
elevado que pb(1 pb) pode tomar 0:25. Logo, se escolhermos
n
2
0; 25 z=2
L2
temos a certeza que o intervalo se estende para cada lado num valor no superior a L.
Captulo 10
Teste de hipteses
10.1
Conceitos bsicos
No captulo anterior vimos como a informao na amostra pode ser usada para estimar
parmetros da distribuio da populao. Neste captulo vamos estudar como que a informao na amostra pode ser utilizada para testar a validade de conjecturas, ou hipteses,
que tenhamos formado sobre a populao.
Por exemplo, sou um produtor de um certo produto e gostaria de assegurar que menos
de 2% dos produtos produzidos so defeituosos. Podemos testar se neste momento a
quantidade de produtos defeituosos inferior ou igual a 2% fazendo uma vericao a
uma amostra aleatria de produtos e decidir depois com base nos resultados obtidos nessa
amostra. Outro exemplo, testar se o salrio o mesmo para mulheres e homens com
mesma qualicao e experincia.
Resumindo, temos uma certa hiptese sobre a populao, conclui-se sobre o mrito ou
no da hiptese usando informao na amostra.
Seja o parmetro de interesse (as ideias podem ser generalizadas para um vector
de parmetros) e suponhamos que temos uma certa hiptese formada sobre o valor do
parmetro, hiptese essa que continuaremos a admitir a no ser que haja forte evidncia de
que a hiptese falsa. A esta hiptese, que designaremos por H 0; chama-se em estatstica
a hiptese nula.
Se a hiptese nula no for verdadeira ento alguma hiptese alternativa ter de o ser.
Ao efectuarmos um teste de hiptese formulamos sempre qual a hiptese alternativa em
relao qual a hiptese nula est a ser testada. A hiptese alternativa designada por
H 1.
Tanto a hiptese nula como a alternativa podem ser simples ou compsitas. Uma
hiptese simples se especicar um valor nico para o parmetro, compsita se especicar
um conjunto de valores.
152
Mtodos Quantitativos
Uma outra distino com interesse entre testes unilaterais e bilaterais. Por exemplo,
o teste de H0 : = 0 contra H1 : 6= 0 um teste bilateral porque a hiptese
alternativa considera valores do parmetro inferiores e superiores aos valores do parmetro
se a hiptese nula for verdadeira. Isto , a hiptese alternativa considera valores esquerda
e direita de 0 .
Depois de especicadas as hipteses nula e alternativa e de termos recolhida uma
amostra temos que decidir se devemos ou no rejeitar a hiptese nula com base na informao da amostra. Temos que ter algum critrio para decidir. Consideremos o exemplo
de testar se h ou no discriminao nos salrios. O parmetro de interesse a diferena
entre mdia de salrios das mulheres e homens. Podemos formular H 0 : H M = 0
e H1 : H M 6= 0. Em termos intuitivos se obtivermos uma diferena das mdias
na amostra muito elevada natural que rejeitemos a hiptese nula, se obtivermos uma
diferena pequena talvez no haja evidncia para a hiptese de no discriminao ser
rejeitada. Mais frente, veremos que o critrio de deciso tem uma base estatstica: no
s a diferena das mdias na amostra que importante, tambm temos de levar em
considerao a variabilidade do estimador X H X M .
Antes de avanarmos, h um pormenor de linguagem que gostaria de discutir. Qual
a expresso mais correcta aceitar a hiptese nula ou no rejeitar hiptese nula?
No rejeitar a hiptese nula est mais de acordo com o estatuto de H0 como hiptese
mantida.
Como a nossa deciso baseada s numa amostra, no possvel conhecermos o valor
do parmetro na populao, logo no possvel ter a certeza se H0 falsa ou verdadeira.
Nestas circunstncias, pode acontecer que a deciso tomada sobre a rejeio ou no da
hiptese nula seja errada. H dois tipos de erros que podem ocorrer: um rejeitarmos a
hiptese nula quando ela verdadeira, este chamado erro do tipo I. O outro erro que
podemos cometer no rejeitar a hiptese nula quando ela falsa, este chamado erro
do tipo II. Resumindo em tabela:
No Rejeitar
Rejeitar
H0 Verdadeira
Deciso correcta
1
Erro do tipo I
nvel de signicncia
H0 Falsa
Erro tipo II
Deciso Correcta
1
potncia do teste
Captulo 10
Teste de hipteses
153
154
Mtodos Quantitativos
Captulo 10
155
Teste de hipteses
X
6
20
1
20y
= P Y 6; p =
=
(1=2)y = 0:0577
y (1=2)
2
y=0
2. Probabilidade do Erro do tipo II - depende qual dos valores da alternativa que
consideramos. Se escolhermos p = 14 o valor de :
X
20
20
1
y
20y
= P 7 Y 20; p =
=
= 0:2142
y (1=4) (3=4)
4
y=7
enquanto que se p =
1
10
o valor de :
X
20
20
1
y
20y
= P 7 Y 20; p =
=
= 0:0024
y (1=10) (9=10)
10
y=7
3. Funo Potncia - o que queremos aqui 1 para os diferentes valores de p que
constituem a hiptese alternativa
K(p) = 1 (p) =
6
X
20
y
y=0
p y(1 p)20y
K(1=2) = = 0:0577, K(1=4) = 0:7858; K(1=10) = 0:9976. Verica-se que quanto mais
baixo for o valor de p relativamente hiptese nula p = 12 , maior a potncia do
teste.
Um outro conceito muito importante o de valor de probabilidade do teste ou valor p.
O valor p a probabilidade de obter um valor da estatstica to ou mais extremo do que
o resultado obtido, se H0 for verdadeiro. Na determinao do valor de p importante ter
em conta se o teste unilateral ou bilateral. A Figura 10.3 ilustra o conceito de valor p
num teste bilateral da hiptese H0 : = 0 contra a alternativa H1 : 6= 0 . O valor da
mdia na amostra foi de x. A probabilidade da mdia na amostra ser superior ou igual a
x ou inferior ou igual a x, quando a mdia na populao 0 igual a p. O valor p a
rea a cinzento na gura. A Figura 10.4 ilustra o conceito de valor no teste unilateral de
H 0 : = 0 contra a alternativa H1 : > 0.
156
Mtodos Quantitativos
O valor p pode ser usado no teste de hipteses. De facto, se o valor p for inferior ao
nvel de signicncia ento devemos rejeitar a hiptese nula. Caso contrrio, se o valor
p for superior ao nvel de signicncia pretendido, no se deve rejeitar a hiptese nula.
Alis, frequente denir o valor p como o valor mnimo do nvel de signicncia para o
qual H0 rejeitado tendo em conta o valor da estatstica. Por exemplo, se o valor p
0.005 isso signica que a hiptese nula rejeitada mesmo para que o nvel de signicncia
seja 0:5%.
10.2
10.2.1
Captulo 10
157
Teste de hipteses
X 0
p N(0; 1)
= n
Esta informao suciente para podermos determinar a regio crtica, para um dado
nvel de signicncia, . A regio critca, em cada um dos casos, :
1. H1 : 6= 0
x
p0
= n
< z=2
p
ou se
> z=2. Isto equivalente a rejeitar H0 se x < 0 z=2= n ou se
p
x > 0 + z=2 = n. Na Figura10.5 est representada a regio critca para um nvel
de signicncia de 5%.
x
p0
= n
2. H1 : < 0
Queremos escolher a regio critca de forma a que a probabilidade de rejeitar a
hiptese nula quando ela verdadeira . Como na alternativa o valor do parmetro
est abaixo de 0 isto equivale a escolher o valor z tal que P ( Z z ) = . Neste
p
p0 < z , ou equivalentemente, se x < 0 z = n.
caso H0 rejeitado se x
= n
158
Mtodos Quantitativos
3. H1 : < 0
Queremos escolher a regio critca de forma a que a probabilidade de rejeitar a
hiptese nula quando ela verdadeira . Como na alternativa o valor do parmetro
est abaixo de 0 isto equivale a escolher o valor z tal que P ( Z z ) = . Neste
p
x0
p > z , ou equivalentemente, se x > 0 + z = n.
teste H0 rejeitado se =
n
Exemplo 10.2 Um produtor de detergentes argumenta que a mdia do peso das caixas
do seu detergente 500 gramas. Sabe-se que a distribuio do peso normal, com desvio
padro igual 12.5 gramas. Numa amostra aleatria de 20 caixas o peso mdio foi de 485
gramas. Teste o argumento do produtor contra a alternativa que o peso inferior a 500
gramas, para um nvel de signicncia de 5%.
Soluo: O valor critco z tal que P ( Z z ) = 0:05 1:645. Por conseguinte a
hiptese nula deve ser rejeitada se Z < 1:645. Para a amostra recolhida o valor de z :
z=
485 500
p = 5:37:
12:5= 20
10.2.2
Se a varincia no for conhecida teremos que estim-la usando a amostra. Neste caso
sabemos que se a hiptese nula for verdadeira,
T =
X 0
p tn1
S= n
Captulo 10
159
Teste de hipteses
isto sugere que T seja uma estatstica apropriada para usar no teste de H0 : = 0 contra
a alternativa H1 : 6= 0. Com = 0 sabemos que
P T t =2;n1 ou T t=2;n1 =
Dada uma amostra especca de dimenso n com mdia x e desvio padro s a regra de
deciso : rejeitar H0 : = 0 se e s se
x
p 0 t=2;n1 ou
s2=n
x
p 0 t=2;n1
s2=n
Se a alternativa fosse H1 : < 0 ou H1 : > 0 fcil por paralelo com o que zemos
atrs construir o teste com nvel de signicncia .
Exemplo 10.3 Uma empresa produtora de papel tomou vrias medidas para reduzir a
descarga de poluentes num rio vizinho. Os responsveis da empresa acreditam ter reduzido
o contedo de poluentes nas descargas de uma mdia anterior = 500 (avaliando a
poluio na gua em ppm). Para testar se a mdia baixou a empresa pensa fazer leituras
do nvel de poluio da gua em 25 dias consequtivos. Tratando estes 25 valores como
uma amostra aleatria, construir um teste com = 0:01. Suponha que depois de feitas as
leituras se obteve x = 308:8 e s = 115:15.
O teste mais apropriado H0 : = 500 contra a alternativa H 0 : < 500. Neste caso
o teste s de um dos lados da hiptese nula. A hiptese nula deve ser rejeitada se e s se
t=
x 0
p t0:01;24 = 2:492
s= 25
308:8 500
p = 8:3
115:15= 25
115:5
) [244:2; 373:4]
5
160
Mtodos Quantitativos
Observaes:
Se a amostra for grande e a varincia desconhecida a distribuio normal apropriada
quer a populao tenha distribuio normal ou no.
Se a hiptese nula fosse do tipo H0 : 0 contra a alternativa H0 : > 0 o
teste o mesmo que se H0 : = 0 contra a alternativa H0 : > 0. Qual a
intuio? Se a mdia da populao for exactamente 0 a probabilidade de rejeitar
a hiptese nula com o teste proposto . Mas, se a mdia da populao for inferior
a 0 a probabilidade de a estatstica cair na regio crtica ainda menor. Ou seja,
a probabilidade do erro do tipo 1 no mximo .
10.3
Tal como seria de esperar estes ensaios so baseados na varincia da amostra s2 . A base
para o teste o facto da varivel aleatria
2
Xn1
=
(n 1)S 2
2
ou
(n 1)s2
2
< Xn1;1=2
20
Captulo 10
161
Teste de hipteses
2
2
Na tabela da Qui-quadrado podemos vericar que X29;0:025
= 45:72 e que X29;0:975
=
16:05. O valor da estatstica na amostra
(30 1) 147:82
= 42:86
100
Logo com base nesta amostra no possvel rejeitar a hiptese nula de que 2 = 100.
Se construirmos o intervalo de conana (95%) para a varincia obtinhamos
(30 1) 147:82
(30 1) 147:82
2
) [93:76; 267]
45:72
16:05
ou seja o intervalo de conana contm 100, o que consistente com o resultado do teste.
10.4
Z=p
Z=p
tem distribuio normal. Se a hiptese nula estiver a ser testada contra a alternativa
H 0 : p 6= p0 e o nvel de signicncia desejado for , a regra de deciso : rejeitar a
hiptese nula se
jb
p p0 j
> z=2
p0(1 p0 )=n
Exemplo 10.5 Numa amostra de 802 compradores, 378 foram capazes de dizer qual era o
preo do produto que tinham acabado de colocar no carrinho de compras. Faa um ensaio
da hiptese de que pelo menos 50% dos compradores so capazes de dizer correctamente
162
Mtodos Quantitativos
o preo contra a alternativa de que aquela proporo na populao inferior a 50% com
um nvel de signicncia de 10%. Encontre tambm o valor-p deste teste.
Soluo: Queremos testar H0 : p 0:5 contra a alternativa H1 : p < 0:5. A regra de
deciso rejeitar a hiptese nula se
pb p0
< z = 1:28
p0(1 p0)=n
pb p0
:471 :5
z=p
=p
= 1:64
p 0(1 p0)=n
:5 :5=802
10.5
10.5.1
(X Y ) (X Y )
r
2X
2Y
nx + ny
tem distribuio N(0; 1). Se as varincias das duas populaes forem conhecidas podem
fazer-se ensaios de hipteses baseados neste resultado. Mesmo que as varincias no
sejam conhecidas desde que as amostras sejam grandes possvel substituir a varincia
na populao pela varincia na amostra e continuar a usar a distribuio normal (pelo
teorema do limite central) e isto verdade mesmo que a populao no seja normal.
Seja H0 : X Y = d0 a hiptese nula que queremos testar contra H1 : X Y 6= d0
ento a regra de deciso : rejeitar H0 se
j(x y) d0 j
r
> z=2
2X
2Y
nx + ny
Captulo 10
163
Teste de hipteses
Mesmo escolhendo um nvel de signicncia muito baixo a hiptese nula rejeitada. Por
exemplo, para = 0:0001 (ou seja :01%) o valor de z = 3:75 o que signica que a hiptese
nula deve ser rejeitada mesmo a este nvel de signicncia.
10.5.2
Amostras pequenas
Se as amostras forem pequenas e se for razovel admitir que a varincia das duas populaes a mesma podemos usar o facto de a varivel aleatria
T =
(X Y ) (X Y )
q
y
S nnxx+n
ny
2 + (n 1)S 2
(nx 1)SX
y
Y
nx + ny 2
164
Mtodos Quantitativos
10.6
(nx 1)S2X
(nx 1) 2X
(ny 1)SY2
(ny 1) 2Y
S2X
2X
SY2
2Y
) para H0 ) F =
2
SX
S2Y
Os valores extremos da regio critca dependem do tipo de teste que desejamos efectuar
(se hiptese alternativa tem que estar s para um dos lados da nula ou se o teste bilateral).
Exemplo 10.7 Um biologista que estuda aranhas est convencido que, numa certa espcie de aranhas, as fmeas so mais compridas que o macho e que o comprimento nas
fmeas varia mais do que o comprimento nos machos. Assumindo que o comprimento
uma varivel aleatria normal e que o comprimentos das fmeas, X , e machos, Y , so indepentes teste a hiptese de que a varincia no comprimento das fmeas igual varincia
no comprimento dos machos contra a alternativa de que a varincia no comprimento das
fmeas maior com base em amostras de 30 fmeas e 30 machos para um nvel de signicncia = 0:01. Os resultados nas amostras foram os seguintes: x = 8:153; s2x = 1:410;
y = 5:917; s2y = 0:4399.
Soluo: Queremos testar H0 :
F
2X
2Y
= 1 contra a alternativa H1 :
2X
2Y
s2x
1:410
=
= 3:2053 > F0:01 (29; 29) = 2:42
2
sy
0:4399
Logo a hipotese nula e rejeitada. A evidncia suporta o biologista.
> 1. A estatistica
Captulo 11
11.1
At aqui zemos anlise de dados de uma varivel. Mas pode acontecer estarmos interessados em analisar duas ou mais variveis numa determinada amostra. Nestas circunstncias,
para alm do estudo individual de cada uma das variveis, podemos ter interesse em estudar eventuais relaes entre as variveis.
A relao a que nos estamos a referir uma relao estatstica. Por exemplo, consideremos a relao entre a idade do marido e a idade da mulher. Embora no exista uma
relao exacta entre a idade do marido e da mulher, em termos mdios quanto mais velho
o marido, mais velha a mulher. As variveis idade do marido e idade da mulher
so positivamente correlacionadas.
O ponto de partida para se estudar a relao entre duas variveis termos uma coleco
de observaes das duas variveis:
(x1 ; y1) ; (x2 ; y2 ) ; ; (xn ; yn ) :
| {z }
| {z }
| {z }
1a observao 2 a observao
na observao
166
Mtodos Quantitativos
Idade marido
32
25
50
45
Idade mulher
30
27
30
40
Casal 5
Casal 6
Casal 7
Casal 8
20
35
60
42
20
32
55
34
Casal 9
Casal 10
27
30
28
28
Cov(x; y) = E (x x)(y y )
Cov(x; y)
xy
Captulo 11
167
que uma estimador pontual. possvel mostrar que, se a distribuio conjunta das
variveis x e y for normal bivariada, o estimador
r
(1
r2)=(n
2)
tn2:
168
Mtodos Quantitativos
11.1.1
Captulo 11
169
11.2
A ideia essencial nesta seco a de estudar a dependncia entre duas variveis aleatrias,
X e Y . Se a v.a X toma um certo valor, qual o valor que esperamos que Y tome (o
valor de X inuencia o valor de Y ).
Podemos interpretar isto no contexto da distribuio conjunta das variveis X e
Y . Aquilo em que estamos interessados na distribuio condicionada de Y dado X,
E [Y jX = x]. Em particular, a pergunta feita anteriormente refere-se ao valor esperado
de Y dado X (o valor esperado da distribuio condicionada). Exemplo, X = tempo de
estudo, Y = nota.
O objectivo da regresso modelar a relao referida. partida o valor esperado de Y
dado X pode assumir qualquer forma funcional (linear, exponencial, log-linear,...). Mas,
muitas vezes razovel admitir que esta relao linear no intervalo relevante
E [Y jX = x] = 0 + 1x
onde o parmetro 0 a interseco na origem e 0 o declive da recta.
Se a dependncia linear entre X e Y no for perfeita o valor de Y divergir do seu
valor esperado condicionado. Por outras palavras o modelo da populao que estamos a
admitir :
yi = 0 + 1 xi + "i
onde "i tem mdia zero. Uma interpretao do termo "i que ele incorpora a inuncia
de uma variedade de pequenos factores independentes que inuenciam Y , para alm de
X.
Um aspecto muito importante na relao anterior a interpretao de 1. O parmetro
1 mede a sensibilidade da varivel Y a variaes em X. Se X aumentar de 1 unidade o
valor de Y aumenta 1 unidades.
170
Mtodos Quantitativos
Por sua vez, o parmetro 0 indica-nos qual o valor esperado da varivel Y quando
X = 0. Contudo, de realar que embora esta interpretao esteja correcta do ponto de
vista matemtico ela pode no fazer sentido em termos econmicos. Em termos econmicos
pode no fazer sentido o caso em que X = 0. Para alm disso, a hiptese de que a relao
entre Y e X linear pode vericar-se para um certo intervalo de valores de X, mas no
se vericar para valores de X muito afastados daquele intervalo, e em particular no ser
vlida na vizinhana do ponto X = 0.
A Figura 11.4 ilustra o modelo da populao que estamos a admitir. O valor da varivel
dependente, yi , pode divergir do seu valor esperado tendo em conta xi. Essa diferena o
termo residual "i.
O modelo de regresso da populao muito interessante. Contudo, na prtica, nunca o poderemos determinar de forma completamente precisa. Na prtica, aquilo que
fazemos usar uma amostra para estimar o modelo anterior. A questo que se coloca a seguir : como estimar este modelo com base na informao de uma amostra
(x1; y1 ); (x2; y2); ; (xn ; y n)?. Teremos que estimar os parmetros 0 e 1 , para isso
podemos utilizar o mtodo dos mnimos quadrados. Se soubermos qual a distribuio
conjunta de "i (normalmente assume-se normal multivariada) podemos tambm utilizar o
mtodo da mxima verosimilhana.
Exemplo 11.2 Funo consumo keynesiana
Na seu livro General theory (1936) Keynes defende que o Consumo depende do rendimento. Ou seja, se designarmos por C o consumo e por Y o rendimento, temos que
C = f (Y ). Para alm disso, Keynes sugere que quando o rendimento aumenta o consumo
tambm aumenta, mas menos que o rendimento. Por outras palavras, a derivada dC
dY
Captulo 11
171
11.2.1
yi
|{z}
valor observado
n
X
e2i =
i=1
n
X
i=1
(b0 + b1xi):
| {z }
valor previsto
(y i (b0 + b1xi))2 :
n
X
i=1
(y i (b 0 + b1xi))2 :
172
Mtodos Quantitativos
Estas equaes so frequentemente designadas por equaes normais. Resolvendo o sistema obtemos:
(
b 0 = yP b1x
b1 =
n
i=1
P n(xi x)(yi y)
2
i=1(xi x)
Pn
i=1 xi yi nx y
P
n
2
2
i=1 xi nx
cov(x;y)
var(x)
A primeira equao permite-nos concluir que a recta de regresso passa no ponto mdio,
(x; y). Isto um facto muito til, porque facilita imenso o clculo de b0 uma vez conhecido
o valor de b 1. Para alm disso, a segunda equao diz-nos que valor de b1 dado pela
covarincia na amostra entre x e y dividida pela varincia de x, o que se pode tambm
exprimir usando o coeciente de correlao, ou seja:
b1 =
cov(x; y)
sy
= :
var(x)
sx
Exemplo 11.3 Uma empresa de fast-food est interessada em estudar a inuncia das
despesas de publicidade nas vendas. Na tabela seguinte esto indicadas as variaes percentuais, relativamente ao ano anterior, nas despesas de publicidade e nas vendas nas 8
regies do pas onde a empresa opera:
Variao % nas
despesas publicidade (xi )
Variao % nas
vendas (y i)
14
10
24
7.2
10.3
9.1
10.2
4.1
7.6
3.5
Soma
xi
0
4
14
10
9
8
6
1
52
yi
24
7.2
10.3
9.1
10.2
4.1
7.6
3.5
54.4
xiyi
0
28:8
144.2
91
91.8
32.8
45.6
3.5
437.7
x2i
0
16
196
100
81
64
36
1
494
Captulo 11
173
Logo
54:4
437:7 8 52
8 8 = 0:19027
494 52
= 6:8 0:19027 6:5 = 5:5632:
b1 =
b0
Exemplo 11.4 Estimao da funo consumo keynesiana com dados dos Estados-Unidos
para perodo (1950-1985). Os resultados so:
b = 11:374 + 0:898 Y
C
(9:629)
(0:006)
11.2.2
A regresso pode ser vista como uma tentativa de explicar o comportamento da v.a. Y
usando informao sobre a v.a. X. Qual a capacidade do modelo para explicar as
variaes ocorridas na amostra na varivel Y ? Se Y tem uma certa variabilidade na
amostra que proporo dessa variabilidade pode ser explicada atravs da dependncia
linear de Y sobre X?
Podemos decompor a variabilidade total de Y em duas componentes: a variabilidade
explicada pela regresso e a variabilidade residual (veja a Figura 11.5). Designemos por
ybi o valor previsto da varivel y de acordo com a regresso, ou seja, ybi = b0 + b 1xi . Tendo
em conta os valores da amostra a regresso estimada pode escrever-se:
yi = b0 + b1 xi + ei , yi = ybi + ei:
i=1
i=1
i=1
174
Mtodos Quantitativos
|i=1 {z
variao total
Ao rcio
|i=1 {z
variao explicada
n
X
e2i
|i=1
{z }
varia o residual
Pn
(b
yi y)2
R = Pi=1
n
2
i=1(yi y)
2
11.2.3
Se certas condies forem satisfeitas, os estimadores obtidos usando o mtodo dos mnimos
quadrados (ordinary least squares OLS) possuem propriedades bastante desejveis. Nestas seco vamos enunciar as hipteses tradicionais do modelo de regresso linear simples
e enunciar uma consequncia dessas hipteses: o teorema de Gauss-Markov.
Captulo 11
175
i = 1; 2; ; n
11.3
176
Mtodos Quantitativos
Pn
(xi x)(yi y)
(xi x)( 1(xi x) + "i)
i=1
i=1
Pn
Pn
E(b 1) = E
=E
2
2
i=1(xi x)
i=1 (x i x)
Pn
i=1 E [(xi x)"i ] =
= 1 + P
n
1
2
i=1(xi x)
Usando as propriedades sobre a varincia tambm possvel mostrar que
2"
2
i=1(xi x)
var(b) = Pn
Isto no resolve ainda o problema porque 2" desconhecido. Mas, 2" pode ser estimado
usando como estimador a varincia dos resduos na amostra
Pn 2
e
2
s = i=1 i
n2
onde a diviso por n 2 resulta do facto de dois parmetros terem sido estimados e logo
haver a perda de dois graus de liberdade. A s chama-se o desvio-padro da estimativa.
A distribuio de b0 e a distribuio de b1 dependem da dimenso da amostra e da
funo de distribuio dos erros. Se a amostra for grande, a distribuio de bj aproximase da normal seja qual for a distribuio dos erros (isto uma consequncia do teorema
do limite central). Se a amostra for pequena e os erros forem normais a distribuio de
bj j
sbj
j = 0; 1
Captulo 11
177
ou se
bj 0j
> tn2;=2 :
sbj
11.4
Previso
Podemos utilizar o modelo de regresso para prever o valor da varivel explicada, tendo em conta um determinado valor da varivel explicativa. Suponhamos que a varivel
independente igual a xn+1 e que a relao linear estimada continua a ser vericada,
ento:
Yn+1 = 0 + 1 xn+1 + "n+1
e
E [Yn+1jxn+1] = 0 + 1xn+1:
178
Mtodos Quantitativos
claro que 0 e 1 no so conhecidos e tambm no sabemos qual vai ser o valor de "n+1.
natural substituir os parmetros 0 e 1 pelas estimativas b0 e b1 . Por conseguinte, uma
estimativa pontual de Yn+1 :
bn+1 = b 0 + b1xn+1.
Y
1
(xn+1 x)2
b
Yn+1 tn2;=2
1 + + Pn
s2e
2
n
(x
x)
i
i=1
Tambm se podem construir intervalos de conana para E [Yn+1jxn+1], a ideia
estimar o valor mdio de Yn+1 tendo em conta que o valor da varivel independente
xn+1 . A varincia deste valor esperado condicionado menor que a varincia de Yn+1
porque aqui a varincia de "n+1 no includa. Neste caso, o intervalo de conana dado
por:
s
2
1
(x
x)
n+1
2
Ybn+1 tn2;=2
+ Pn
2 se
n
(x
x)
i=1 i
interessante analisar como que os diferentes factores afectam o intervalo de conana. Por um lado, quanto maior for n menor a varincia dos estimadores b0 e b1 e,
logo, menor a amplitude do intervalo de conana.
Para alm disso, quanto menor for s2e , menor a amplitude do intervalo de conana.
Isto bastante intuitivo porque s2e o estimador de 2" , e claro que quanto menor a
variabilidade dos resduos, menor ser a variabilidade do valor observado de Y em relao
ao seu valor esperado.
P
Um aspecto interessante a inuncia do termo ni=1(xi x)2. Repare-se que isto
um mltiplo da varincia da varivel explicativa. Quanto maior for a variabilidade na
Captulo 11
179
varivel explicativa, maior a preciso dos estimadores dos mnimos quadrados (ou seja,
menor a sua varincia). Mas isso reduz a amplitude do intervalo de conana.
Por ltimo, quanto mais xn+1 estiver afastado da mdia x, maior a amplitude do
intervalo de conana. Ou seja, a preciso com que conseguimos estimar Yn+1 decresce
medida que xn+1 toma valores mais afastados da mdia.
11.5
At aqui assumimos que a relao entre a varivel explicativa e a varivel explicada era
linear. Mas, possvel que o modelo terico de que partimos, ou dados usados, ou ambos,
sugiram que a relao no linear. curioso que o modelo de regresso linear que
acabamos de estudar se pode aplicar a muitas outras formas funcionais. De facto, em
muitos casos possvel, usando transformaes das variveis originais, continuar a ter um
modelo que linear nos parmetros. Nestes casos, podemos usar o modelo de regresso
linear simples. Vejamos exemplos destas ideias
Exemplo 11.6 Consideremos a seguinte relao entre y e x:
1
yi = 0 + 1( ) + "i
xi
Esta forma funcional no linear na varivel explicativa. Contudo, o modelo linear nos
parmetros 0 e 1 e, por conseguinte, podemos usar o OLS para o estimar. A nica coisa
que temos que fazer comear por calcular x1i para todas as observaes e, depois, basta
regredir yi sobre a nova varivel x1i :
claro que, se a forma funcional for a descrita e estivermos interessados em calcular
quanto que varia a varivel explicada quando a varivel explicativa aumenta de 1 unidade,
a resposta no to imediata como no modelo linear nas variveis. Mas para responder
basta calcular a derivada de y relativamente a x:
dy i
= 21 :
dxi
xi
Exemplo 11.7 Suponhamos que a relao entre y e x descrita por:
yi = xi 1 exp ("i )
Apesar deste modelo ser no linear, podemos transform-lo num modelo linear. Para isso
basta calcular o logaritmo de ambos os membros :
ln yi = ln + 1 ln xi + "i
180
Mtodos Quantitativos
Este modelo frequentemente designado por log-linear (existe uma relao linear entre o
logaritmo das variveis). Para estimar o modelo comeamos por calcular os logaritmos das
variveis explicada e explicativa para todas as observaes e depois fazemos uma regresso
linear entre ln y e ln x.
O parmetro 1 neste modelo tem uma interpretao muito curiosa: a elastecidade
de y relativamente a x. Ou seja, se x aumentar de 1% a varivel explicada aumenta 1%.
fcil mostrar este resultado derivando ambos os lados em ordem a xi :
d(ln yi ) dyi
d(ln xi)
1 dyi
1
= 1
,
= 1
dyi dxi
dxi
yi dxi
xi
dyi xi
= 1 .
dxi yi
Captulo 12
Regresso mltipla
12.1
182
Mtodos Quantitativos
O parmetro 1 indica-nos a variao esperada na varivel explicada quando x1 aumenta de uma unidade, assumindo que todas as outras variveis se mantm constantes. Por
outras palavras, 1 mede a sensibilidade da varivel explicada relativamente a variaes
em x1 .
De forma semelhante, o parmetro i indica-nos a variao esperada na varivel explicada quando xi aumenta de 1 unidade, assumindo que todas as outras variveis se
mantm constantes. Os parmetros i so frequentemente designados por coecientes de
regresso parciais, porque fornecem uma medida da inuncia de cada uma das variveis
independentes na varivel explicativa.
12.1.1
Para trabalhar com o modelo de regresso linear mltipla facilita bastante utilizar notao
matricial. Tendo em conta o conjunto de n observaes, o modelo de regresso descrito
por:
8
>
y1 = 0 + 1x11 + 2 x21 + + k xk1 + "1
>
>
>
< y2 = 0 + 1x12 + 2 x22 + + k xk2 + "2
..
>
>
.
>
>
:
yn = 0 + 1x1n + 2 x2n + + kxkn + "1
Em termos matriciais estas equaes podem escrever-se da seguinte forma:
2
3 2
32
3 2
3
y1
1 x11 x21 xk1
0
"1
6
7 6
76
7 6
7
6 y2 7 6 1 x12 x22 xk2 76 1 7 6 "2 7
6 . 7=6 . .
7
6
7
6
7
..
..
6 . 7 6. .
76 .. 7 + 6 .. 7
4 . 5 4. .
.
.
54 . 5 4 . 5
yn
| {z }
Y
Ou seja:
1 x1n x2n
{z
xkn
k
}| {z }
"n
| {z }
"
Y = X + ":
12.2
Captulo 12
183
Regresso Mltipla
yi
b
184
Mtodos Quantitativos
Ser que neste modelo possvel dar uma interpretao adequada estimativa b0 ?
Interprete as estimativas dos restantes coecientes e verique se o sinal desses coecientes
aquele que esperaria obter apriori tendo em conta o modelo terico considerado.
12.3
Tal como no modelo de regresso simples, se certas condies forem satisfeitas, os estimadores dos mnimos quadrados tem propriedades muito desejveis.
Consideremos o modelo da populao:
Yi = 0 + 1x1i + 2 x2i + + k xki + "i
e admitamos que temos conjunto de dados com n observaes. As hipteses seguintes so
normalmente feitas:
1. As observaes x1i, x2i, , xki ou so nmeros xos (xados, por exemplo, por um
experimentador), ou so realizaes de variveis aleatrias X1i , X2;i, , Xk;i que
so independentes do termo residual.
2. Os termos residuais "i so variveis aleatrias com mdia 0:
E ["i] = 0,
i = 1; 2; ; n
Captulo 12
185
Regresso Mltipla
12.4
{z
n
X
(b
yi y)2
i=1
{z
n
X
e2i
i=1
| {z }
n
X
2
(b
yi y)ei
| i=1 {z
186
Mtodos Quantitativos
Ao rcio
Pn
(b
yi y)2
SSR
SSE
R = Pi=1
=
=1
n
2
(y
y)
SST
SST
i=1 i
2
R = 1
SSE=(n k 1)
:
SST =(n 1)
Captulo 12
187
Regresso Mltipla
12.5
188
Mtodos Quantitativos
bj j
< t(nk1);=2
sbj
ou se
bj j
> t(nk1);=2 ,
sbj
Captulo 12
189
Regresso Mltipla
Exemplo 12.3 Uma cadeia de hamburguers est a decidir quanto dinheiro deve gastar
em publicidade e se deve ou no dar descontos especiais durante a prxima semana. Para
estudar o efeito destas variveis nas receitas da empresa partiu-se do seguinte modelo
econmico:
R = 0 + 1p + 2 d
onde R representa as receitas durante a semana, p o preo praticado durante a semana e
d as despesas de publicidade durante a semana (as receitas e as despesas so medidas em
milhares de euros e o preo medido em euros). O modelo estatstico associado :
Ri = 0 + 1p i + 2di + "i;
sendo satisfeitas todas as hipteses do teorema de Gauss-Markov e ainda a hiptese de
que os resduos seguem uma distribuio normal multivariada. Este modelo foi estimado usando as observaes das 52 semanas do ano anterior, tendo-se obtido os seguintes
resultados:
b = 104:785 6:6419p + 2:9843d
R
(6:482)
(3:191)
(0:167)
R2 = 0:862
12.6
Na seco anterior vimos como que podemos realizar teste de hipteses sobre parmetros
individuais. Contudo, pode acontecer que estejamos interessados em testar a hiptese de
que, em simultneo, os parmetros tomam determinados valores.
12.6.1
190
Mtodos Quantitativos
SSR
k
SSE
nk1
ou seja, so levados em conta os graus de liberdade associados a cada uma das somas dos
desvios ao quadrado.
Um resultado importante para podermos efectuar o teste o facto de F seguir uma
distribuio F com k graus de liberdade no numerador e n k 1 graus de liberdade no
denominador.
Usando a tabela da F(k;nk1) possvel calcular o valor critco para um nvel de
signicncia . Se o valor da estatstica F for superior a esse valor critco a hiptese nula
rejeitada.
interessante notar que a estatstica F pode ser calculada a partir do coeciente de
determinao:
F=
SSR
k
SSE
nk1
SSR n k 1
SSR
n k 1
R2 n k 1
=
=
:
SSE
k
SST SSR
k
1 R2
k
Captulo 12
12.6.2
191
Regresso Mltipla
Suponhamos que o modelo que estamos a estimar tem k variveis explicativas e que estamos interessados em testar se k1 (k1 < k) daquelas variveis so ou no, em conjunto,
signicativas.
A hiptese nula que queremos testar :
H0 : 1 = 2 = = k1 = 0:
Se a hiptese nula for verdadeira o modelo da regresso :
Yi = 0 + k1 +1xk1 +1;i + k1 +2xk1 +2;i + + k xk;i + "i;
ou seja s inclu as restante k k1 variveis explicativas e o termo constante. importante
notar que, se estimarmos este modelo, os estimadores obtidos para os k+1k1 coecientes
sero diferentes dos estimadores obtidos quando se incluem na regresso todas as variveis
explicativas. Designemos por SSE a soma dos quadrados dos resduos da regresso que
inclu s as ltimas k k1 variveis explicativas e por SSE a soma dos quadrados dos
resduos da regresso que inclu todas as variveis explicativas.
A ideia do teste, que se a hiptese nula verdadeira SSE e SSE devem divergir
pouco (mas SSE ser sempre inferior ou igual a SSE ). Em concreto, a regra de deciso
baseada na estatstica:
F=
(SSE SSE)
k1
SSE
nk1
Fk1 ;nk1:
12.6.3
> F(k1;nk1);
Por vezes til testar se os coecientes de regresso satisfazem uma determinada restrio
linear. Suponhamos que a hiptese nula a seguinte:
H 0 : c0 0 + c1 1 + + ck k = r , H0 : c0 = r
192
Mtodos Quantitativos
Em geral, alguns dos coecientes ci sero iguais a zero. Tendo em conta a amostra, a
estimativa de c0 c0b :
c0 b = c 0b0 + c 1b1 + + ck bk = b
r
h
i
6 7
H0 : + = 1 ,
0 1 1 4 5 = 1:
Captulo 12
12.6.4
193
Regresso Mltipla
Podemos generalizar os resultados da seco anterior para o caso em que estamos interessados em testar simultaneamente j restries lineares sobre os parmetros. Ou seja a
hiptese nula :
H 0 : C = r
onde C uma matriz de dimenso j (k +1), em que cada linha se refere a uma restrio.
O teste vai ser baseado na diferena Cb r (repare-se que isto corresponde a um vector
de variveis aleatrias). O teste baseado na estatstica F :
h
i1
(Cb r)0 s2e C(X0 X)1C
(Cb r)
F=
j
que segue uma F com j graus de liberdade no numerador e n k 1 graus de liberdade
no denominador.
12.7
Previso
Tendo em conta o teorema de Gauss-Markov, sabemos que este o previsor mais eciente
de Yn+1 na classe de estimadores lineares e no enviesados.
Se, em vez de um estimador pontual, estivermos interessados em obter intervalos de
conana para a varivel dependente, necessitamos de estimar a varincia do erro de
previso:
h
i
h
i
var Ybn+1 Yn+1 = 2 1 + x0n+1(X0X)1 xn+1 :
Substituindo 2 pelo estimador s2e camos com estimador da varincia do erro de previso,
e a partir daqui podemos construir intervalos de conana para Ybn+1 .