Professional Documents
Culture Documents
VORA
Julho de 2001
Agradecimentos
Agradeo ao Professor Russel Alpizar-Jara, meu orientador, pelos sbios conhecimentos, entusiasmo, ateno que sempre me dedicou.
Aos meus queridos pais, cunhada Alcinda, irmos e Nene em particular pelo
amor e ternura ilimitada que foram decisivos no meu empenho durante todos esses
anos de estudos.
Cludia pelo amor, carinho e amizade.
Com apreo e infinita estima agradeo Ana, Andr, Evaldo, Hermes e Njalo
pela amizade e incansvel ajuda na lida do dia-a-dia e muito especialmente na
elaborao do presente trabalho.
Pude compartilhar momentos indelves em companhia de colegas, amigos, docentes e todos vs um muito obrigado pela fora e encorajamento que sempre me
deram. A maravilhasa cidade de vora e sua simptica gente pela hospitalidade.
Tambm, no posso deixar de agradecer Cabo Verde, terra me.
iii
ndice
Lista das Quadros . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
vi
Notao e abreviaturas . . . . . . . . . . . . . . . . . . . . . . . . . . .
viii
1 Introduo
2 Conceitos estatsticos
2.2 Estatsticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
12
19
26
26
3.1.1
Estimao de Lincoln-Petersen . . . . . . . . . . . . . . . .
26
3.1.2
28
iv
3.1.3
32
40
3.2.1
Trajectos Lineares . . . . . . . . . . . . . . . . . . . . . .
40
3.2.2
Funo de deteco . . . . . . . . . . . . . . . . . . . . . .
43
3.2.3
. . . . . . . . . . .
47
3.2.4
50
56
3.3.1
A combinao . . . . . . . . . . . . . . . . . . . . . . . . .
56
3.3.2
57
3.3.3
Estimao de N e g0 . . . . . . . . . . . . . . . . . . . . .
59
66
4 Simulao
73
5 Concluso
87
Apdices
89
Apndice A (Teoremas) . . . . . . . . . . . . . . . . . . . . . . . . . .
89
91
Apndice C (Simulaes) . . . . . . . . . . . . . . . . . . . . . . . . . .
92
List of Tables
3.1 Densidade populacional em funo de g0 . . . . . . . . . . . . . . . . .
49
67
68
70
70
3.7 Estimao de g0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
71
75
83
86
vi
List of Figures
2.1 Inferncia estatstica . . . . . . . . . . . . . . . . . . . . . . . . . . .
2.3
14
2.4
. . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
15
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
16
20
21
pag. 186.
2.7 Estimador pouco preciso, quando comparado com o da Figura 2.8. Rui Guimares,
1997, pag. 267.
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
vii
22
2.8 Estimador preciso, quando comparado com o da Figura 2.7. Rui Guimares,
. . . . . . . . . . . . . . . . . . . . . . . . . . . . .
23
27
. . . .
41
. . . . . . . . . . .
42
43
43
3.6 Vrias tentativas para a funo de deteco : A - Normal truncada , B Uniforme, C - Exponencial Negativa, D - Hazard-Rate, que depois de escolhida
em funo da performance de cada uma faz-se uma ajuste da funo deteco.
44
46
3.8 Dados das distncias de latas de cervejas castanhas obtidas atraves da exper. . . . . . . . . . . . . . . . . . . . . . . . . . .
69
78
incia de Otto,1982.
79
x2
80
81
com
84
85
. . . . . . . . . . . . . . . . . . . . . . . . . . .
86
ix
86
Notaco e abreviaturas
Notaes tais como
P
, , etc. no sero descritas por razes obvias.
Rw
0
Abreviaturas
cv - coeficiente de variao.
i.i.d - independente e identicamente distribudos;
se - desvio padro ( standar error);
v.a.c - varivel aleatria contnua;
v.a.d - varivel aleatria discreta;
xi
1. Introduo
As estimativas do tamanho das populaes so necessrias seja qual for o estudo
ecolgico e (ou) evolutivo. Um conjunto de indivduos da mesma espcie coexistindo num mesmo espao designa-se por populao, N. Uma populao pode
designar a um conjunto de indivduos que vivem, por exemplo, num parque, numa
cidade ou mesmo numa determinada regio dum pas.
Os modelos matemticos tm sido usados para perceber fenmenos ecolgicos.
O desenvolvimento das tecnologias, juntamente com o crescimento da populao
mundial, bem como a caa descontrolada e catstrofes naturais, tm provocado,
a nvel global, vrias alteraes nos ecossistemas, que podem pr em risco as
populaes, reduzindo o seu efectivo ou mesmo, em caso extremo, levar sua
extino. O conhecimento destas alteraes advm principalmente das concluses
inferidas a partir dos modelos matemticos.
Consequentemente formulam-se modelos matemticos que tentam estimar, por
exemplo, o tamanho e a densidade da populao: mtodo Fisher - Ford, mtodo
estocstico de Jolly, mtodo de Jackson, mtodo de Lincoln - Petersen, mtodo
trajectos lineares, entre outros, Beger (1989) e Krebs (1994).
Todavia, existem outros mtodos cuja finalidade o estudo da evoluo da
populao, destes deduzem-se as taxas de natalidade, mortalidade, etc., entre
2. Conceitos estatsticos
ou seja, pretende-se encontrar um modelo que faa com que a amostra seja representativa2 da populao. A questo que se pe muitas vezes, de como extrair
esta amostra da populao. Vrias tcnicas tm sido desenvolvidas nesse sentido, entre as quais se destaca a tcnica de amostragem aleatria,Bento Murteira
(1996).
Para obter uma amostra aleatria utiliza-se o processo de lotaria ou ento um
programa de computador para gerar nmeros aleatrios.
No processo de lotaria, constri-se uma rplica da populao numa urna com
vrias bolas, de tal maneira que cada bola represente um indivduo da populao.
Retira-se ao acaso tantas bolas quanto se queira, at obter-se a dimenso desejada
para a amostra. Esta tcnica prtica quando se trata de populaes pequenas,
mas inconveniente no caso de populaes grandes j que se torna um processo
cansativo.
O processo de nmero aleatrio idntico, mas a urna substituda por
nmeros aleatrios gerados por computador. A cada indivduo atribui-se um
nmero, e a partir do computador gera-se uma quantidade de nmeros aleatrios
correspondente ao tamanho da amostra.
A tcnica de amostragem aleatria garante que dada uma amostra com n observaes, seja (x1 , x2 , ..., xn ), tal amostra a realizao de n variveis aleatrias 3
(X1 , X2 , ..., Xn ) sobre as mesmas condies que se traduzem por:
2
Uma amostra diz-se reprensentativa se for construda de modo que qualquer que seja o
elemento, tenha a mesma probabilidade de pertencer a esta.
3
Define-se como varivel aleatria real X uma representao
simblica de um espao mensurvel (<, B) e de medida de probabilidade P sobre (<, B) onde
< o conjunto dos nmeros reais e B a famlia dos borelianos lineares e onde para todo o
conjunto A <, A B, P (A) a probabilidade do acontecimento X A. Especificar uma
varivel aleatria introduzir um espao de probabilidade (<, B,P ).
uma lei de probabilidade comum , i.e, as variveis tm a mesma probabilidade de serem observadas
(v.a.c)
Numa primeira fase do processo a natureza dos dados , muitas das vezes,
desconhecida. Para tal, os dados so agrupados em categorias para facilitar a
construo de histogramas e grficos de barras. Com estas representaes grficas
pretende-se ajustar os dados a uma funo de distribuio. Nem sempre a funo
de distribuio caracteriza o comportamento dos dados, j que o acesso aos dados
por vezes limitado. Os dados so caracterizados pela funo de distribuio,
que pode depender (F (x|) , )4 ou no (F (x)) de um parmetro (, ou
vector parmetro = (1 , 2 , ..., k )). No caso paramtrico, contrariamente ao
4
2.2. Estatsticas
Definio 1. Dada uma populao com uma funo distribuio paramtrica
F (x|) , )
define-se por uma estatstica T = (X1 , X2 , , Xn ) a todo o processo que se rege
no resumo de toda a informao contida na amostra aleatria X1 , X2 , , Xn
sobre o parmetro desconhecido .
Informao
difcil definir o conceito de informao acima mencionado j que, muitas das
definies propostas tm sido alvo de srias contestaes. Contudo, a definio de
Fisher a que tem maior aceitao.
Sobre a condio de que qualquer funo de densidade (probabilidade) da
famlia F = {f (x|) , } com parmetro escalar satisfaa as condies de
regularidade:
[1 ] intervalo aberto da recta real, podendo mesmo coincidir com toda a
recta real;
[2 ] Os conjuntos {x : f (x|) > 0} so independentes de ;
[3 ]
f (x|)
existe e finita, x e ;
[4 ]
0 < E
ln f (x|)
2 )
<
(2.1)
Para certas funes de densidade por vezes complicado chegar a uma expresso para o segundo membro da equao 2.1. O teorema seguinte mostra que,
sob determinadas condies, nomeadamente condies de regularidade j enunciadas atrs, possvel simplificar 2.1.
Teorema 3. Uma vez que se verifiquem as condies de regularidade, 1-4, e se
R +
a segunda derivada de f (x|) dx se pode obter derivando duas vezes sob a
=X () = E
2
ln f (x|)
2
(2.2)
0=
f (x|)
dx =
ln f (x|)
f (x|) dx
2
Z + 2
Z +
ln f (x|)
ln f (x|)
=
f (x|) dx +
f (x|) dx
x nx
n x
nx
=
ln
(1 )
, 0<<1
1
donde se conclui que
=X () = E
x nx
2 )
n
(1 )
Verosimilhana
Como j foi referido atrs, para uma dada amostra aleatria (X1 , X2 , , Xn )
definindo uma lei de probabilidade f (x|), com o parmetro fixo e fazendo
variar X na amostra, temos diferentes resultados de acordo com essa lei de probabilidades. Fixando agora X e fazendo variar obtem-se a funo de verosimilhana:
L (|X) = L (|x1 , x2 , , xn )
= f (x1 , x2 , , xn |) = f (X|)
(2.3)
(2.4)
ento, de 2.4 pode-se afirmar-se que mais plausvel ter = 1 do que ser igual
a 2 .
Exemplo 5. Para uma amostra de dimenso 5 (n = 5), de uma populao
Binomial(n,)
seja (X1 = 1, X2 = 2, X3 = 3, X4 = 4, X5 = 5)
10
f (x = 1|
f (x = 1|
f (x = 1|
f (x = 1|
5
= 0.01) =
(1 )4
x
5
= 0.05) =
(1 )4
x
5
= 0.10) =
(1 )4
x
5
= 0.25) =
(1 )4
x
= 0.0480
= 0.2036
= 0.3280
= 0.3955
P (x < X < x + )
= P (X < x + ) P (X < x )
=
F (x + ) F (x )
2 (F (x + ) F (x ))
(x + ) (x )
dF (x)
2
= 2f (x)
dx
=
11
P2 (x < X < x + )
L (2 |x)
Tanto para o caso discreto como para o contnuo, a funo de verosimilhana
pode ser definida a menos de um factor constante positivo, que expresso pelo
seguinte principio:
Princpio de verosimilhana
Se x e y so duas amostras da mesma populao tal que L (|x) seja proporcional a L (|y), existir uma constante C (x, y) tal que :
12
Definio 7. Seja Xi uma varivel aleatria com uma lei de probabilidade definida
por:
f (x|)
L (|x1 , x2 , , xn ) =
5
n
Y
i=1
f (xi |)
(2.5)
Alguns mtodos alternativos: mtodo dos mnimos quadrados, mtodo de estimao com
varincia mnima e mtodo dos momentos.
13
1 ,2 ,...,p
1 ,2 ,..., p
n
Y
i=1
f (xi |)
14
L (|x) = 0, j = 1, 2, , p
j
(2.6)
desde que
2 L (|x)
j
=x
2
<0e
L (|x)
< 0 para todo k 6= l
k l
=x
(2.7)
Figura 2.3: A derivada no se anula para qualquer valor finito de ,no entanto a estimativa
da mxima verosimilhana deve ser
= max xi . Bento Murteira, 1996, vol. II, pag. 186.
15
Figura 2.4: O mximo absoluto de L() atingido em enquanto que o emprego da derivao
0
conduz ao mximo relativo 6=
. Bento Murteira, 1996, vol. II, pag. 186.
ln L () = ln
n
Y
i=1
n
X
i=1
f (xi |)
(2.8)
ln f (xi |)
ln f (xi |) , j = 1, 2, p
j
i=1
xi 1
2
Pn
i=1
(xi )2
2 2
e tem-se
=0
=0
Pn
2
i=1 (xi )
2
n2
2
Pn
i=1
=0
(2.9)
(xi X )
2 4
=0
L (|x1 , x2 , , xn ) =
17
n
Y
i=1
f (xi |)
A = B
C D
G () = 0
e ainda limitada a i s .
H () 0
Estimadores suficientes
Definio 9. Uma estatstica T (X1 , X2 , , Xn ) que consiga resumir toda a informao de uma amostra X1 , X2 , , Xn sobre o parmetro ( ) de uma forma
concisa e sem redundncia designa-se por estatstica suficiente.
Uma estatstica diz-se suficiente se e s se a funo distribuio da amostra
(X1 , X2 , , Xn ) aleatria em funo de T = t no depende de ( ), para todo
o t Dt , onde Dt o domnio de T .
19
Estimadores no enviesados
Definio 10. Dado um parmetro ( ) e seja um estimador do mesmo,
define-se como enviesamento :
Enviesamento =
onde valor esperado de .
Um estimador diz-se no enviesado se o valor do enviesamento for nulo,
Figuras 2.5 e 2.6. O estimador no enviesado permite, para amostras diferentes,
obter um estimador que fornece, em mdia, estimativas iguais ao verdadeiro valor
do parmetro.
20
lim ( ) = 0
n+
lim 2
n+
=0
(condies de regularidade)
Estimadores Precisos
Definio 12. Um estimatidor 1 diz-se menos preciso que outro 2 , se a disperso dos erros de estimao que podem ser cometidos for maior quando se recorre
ao estimador 1 , Figuras 2.7 e 2.8. Geralmente, a preciso de um estimador
expressa pelo erro quadrtico mdio:
Erro Quadr
atico m
edio
= EQM = E
= 2 (Enviesamento )2
Figura 2.7: Estimador pouco preciso, quando comparado com o da Figura 2.8. Rui Guimares,
1997, pag. 267.
Propriedade de invarincia
Figura 2.8: Estimador preciso, quando comparado com o da Figura 2.7. Rui Guimares, 1997,
pag. 267.
verosimilhana e se uma funo biunvoca, ento estimador de
= 0
I () = E
2L
2
=E
2 !
ento diz-se assimptoticamente normal com vector mdia 0 e a matriz varincia, onde 0 o real valor de . A matriz I0 conhecida por
covarincia, I1
0
,
matriz informao de Fisher, Efron (1978). A matriz varincia-covarincia, I1
0
P
denotada por .
23
A partir da varincia sabe-se qual a preciso de um estimador e da covarincia, a relao que existe entre dois estimadores particulares, isto , se so ou
no independentes6 , j que foram obtidos a partir dos mesmo conjunto de dados.
X
d
=
var 1
cov 1 , 2
cov 1 , 3 . . . cov 1 , n
cov 2 , 1
var 2
cov 2 , 3 . . . cov 2 , n
cov 3 , 1
cov 3 , 2
var 3
. . . cov 3 , n
..
.
..
.
..
.
..
..
.
var n
P
, as varincias aparecem na diagonal principal da
h i1
= I
0.
24
h i2
h
=
2
E 2 ln L (|X) =
h i2
h
=
2
2 ln L (|X)=
25
(2.10)
Carl George Johannes Petersen nasceu na Dinamarca em 1860. O metodo que hoje tem o
seu nome foi publicado em 1896.
7
Frederick C. Lincoln nasceu em 1892, no Colorado. Passou a maior parte da vida a estudar
passros.
26
n11
n11
LP = n1 n2
N
n2
N
n11
(3.1)
LP o estimador de Lincoln-Petersen.
onde N
Apesar do mtodo ser simples e prtico, pode surgir um pequeno problema;
no caso, de n11 ser zero, isto , no existem indivduos marcados nem na primeira
e nem na segunda fase. Para resolver tal situao, em 1951 Chapman introduziu
pequenas modificaes na formula 3.1:
(n1 + 1) (n2 + 1)
LP
1
=
N
n11 + 1
(3.2)
= p1 (1 p2 );
P01 = P
=P
= (1 p1 ) p2 ;
P11 = P
29
[0, 1] ;
=P
= p1 p2 ;
P00 = P
=P
= (1 p1 ) (1 p2 );
Considerando n10 , n01 e n11 como variveis aleatrias, que seguem uma distribuio multinomial e tendo em conta os pressupostos do mtodo, a funo da
mxima verosimilhana toma o seguinte aspecto:
n10
N
[p1 (1 p2 )]n10 [(1 p1 ) p2 ]n01 [p1 p2 ]n11 [(1 p1 ) (1 p2 )]n00
n01 n11
(3.3)
N
[p1 (1 p2 )]n10 [(1 p1 ) p2 ]n01 [p1 p2 ]n11
n10 n01 n11
[(1 p1 ) (1 p2 )]Nn
30
(3.4)
(consultar Apndice A)
N n
Nn
=
p (1 p)
n
n
n
n
n
p1 (1 p2 ) 10 (1 p1 ) p2 01 p1 p2 11
(3.5)
n10 n01 n11
p
p
p
onde n = n10 + n01 + n11 e portanto
Pn = P11 + P10 + P01
= p1 (1 p2 ) + (1 p1 ) p2 + p1 p2
= p1 + p2 p1 p2 = p
Estimao de N
Uma das possveis maneiras de estimar N resolvendo o seguinte sistema:
LLP () = 0
L1LP ()
N
=0
L1LP ()
p
=0
L1LP ()
N
=0
n
p (1 p)Nn = 0
N
p n
N n
p (1 p)Nn = 0
p n
N n1
Nn1
p
(n (1 p) p (N n)) = 0
(1 p)
n
n (1 p) p (N n) = 0
31
n Np = 0
p=
Donde sai que p =
n
,
N
n
N
ou seja:
=n
N
p
(3.6)
p1 =
n11
n2
(3.7)
e
p2 =
n11
n1
(3.8)
d
Definio: Se uma funo (x) tem derivada de ordem r tal que (r) (x) = dx
r (x), ento
para uma constante a, o polinmio de Taylor de ordem r em torno de a dado por Tr (x) =
Pr (r)
i
i=0 i! (x a) .
1
32
i () =
(X)
|X1 =1 ,X1 =2 ,...,Xk =k
Xi
(X) () +
r
X
i=0
i () (Xi i )
(3.9)
E (X) () +
r
X
i=0
i () E (Xi i ) = ()
(3.10)
33
r
r
2
X
X
0
0
0
i () var (Xi ) + 2
var (X)
i () j () cov (Xi , Xj )
i=0
(3.11)
i>j
Caso Hipergeomtrico
No caso hipergeomtrico a varincia calculada condicionando n1 e n2 , ou seja,
parte-se do princpio que n1 e n2 so conhecidos. A nica grandeza no fixa
ser n11 , varivel que tem distribuio hipergeomtrica. Assim, temos a seguinte
funo de verosimilhana:
n1 Nn1
n11
N2
n2
34
n11
(3.12)
E (n11 ) =
n1 n2
= n1 n2
N
N
n11
d
vd
ar (z)
dz
.d
var (z) =
z=z
1
var (z)
4z
n1 n2
ar
vd
ar NLP = vd
n11
ar
n21 n22 vd
1
n11
ao conhecidas)
(P ropriedade da variancia assmindo que n1 e n2 s
O mtodo dos momentos foi desenvolvido no prncipio deste sculo por Karl Pearson para
produzir estimadores de parmetros.
35
n21 n22
vd
ar (n11 )
n411
n11 y H (N, k, p)
tal que:
O parmetro N tem como estimador a estimao de Lincoln-Petersen, i.e,
LP =
N
n1 n2
;
n11
n1
.
N
p =
n11
n2
e a probabilidade de
n2 n11
;
n2
vd
ar (n11 ) n2
n11 n2 n11
n2
n2
n1 n2
n2
n11
n1 n2
1
n11
36
:
e por conseguinte a varincia estimada de N
(3.13)
(Seber, 1982)
(n + 1) (n + 1) (n n ) (n n )
1
2
1
11
2
11
LP
=
vd
ar N
2
(n11 + 1) (n11 + 2)
(3.14)
Caso Multinomial
Atendendo que n1 e n2 podem ser expressos respectivamente por n10 + n11 e
n01 + n11 , tambm possvel obter uma estimativa para a varincia traduzindo
o problema numa multinomial, onde n10 , n01 e n11 so variveis aleatrias. A
funo de mxima verosimilhana para o caso multinomial a expresso 3.5 atrs
apresentada.
Seja (z10 , z01 , z11 ) =
(n
n
n
+
n
)
(n
+
n
)
1
2
10
11
01
11
LP
= vd
ar
= vd
ar
vd
ar N
n11
n11
2
2
d
d
.var (n10 ) +
.var (n01 )
dz10 z10 =z
dz01 z01 =z
10
01
37
2
d
+
.var (n11 ) +
dz11 z11 =z
11
d
d
.cov (n10 , n01 ) +
+2
dz10 z10 =z
dz01 z01 =z
01
10
d
d
.cov (n10 , n11 ) +
+
dz10 z10 =z
dz11 z11 =z
10
11
!
d
d
.cov (n11 , n01 )
dz11 z11 =z
dz01 z01 =z
11
01
(n10 + n11 )2
(n01 + n11 )
.var
(n
)
+
.var (n01 ) +
10
n211
n211
((n01 + n10 + 2n11 ) n11 (n10 + n11 ) (n01 + n11 ))2
+
.var (n11 ) +
n411
+
n311
(n01 + n11 ) cov (n10 , n11 ) +
+
n311
38
Uma vez que as variveis aleatrias n01 , n10 e n11 seguem uma distibuio
multinomial4 Mult (n, 10 , 01 , 11 ), onde n = n01 + n10 + n11 e 10 =
01 =
(1p1 )p2
p
e 11 =
p1 p2
p
p1 (1p2 )
,
p
var (n01 ) = n 10 (1 10 );
var (n01 ) = n 01 (1 01 );
var (n01 ) = n 11 (1 11 );
e as seguintes covarincias:
cov (n10 , n01 ) = n 10 01 ;
cov (n10 , n11 ) = n 10 11 ;
cov (n11 , n01 ) = n 11 01 ;
e portanto,
2 2
n
(1
)
(1
)
n
n
n
10
10
01
01
1
2
LP
vd
ar N
+
+
=
n211
n21
n22
((n1 + n2 ) n11 n1 n2 )2
.n 11 (1 11 )
n411
2n2 n2 n 10 01 2n2 ((n1 + n2 ) n11 n1 n2 ) n 10 11
+
+
1 22
n11 n1 n2
n311
2n1 ((n1 + n2 ) n11 n1 n2 ) n 11 01
(3.15)
+
n311
39
vd
ar (
p1 |n2 ) = vd
ar
n11
|n2
n2
vd
ar (n11 |n2 )
n2 p1 (1 p1 )
p1 (1 p1 )
=
=
2
2
n2
n2
n2
(3.16)
ar
vd
ar (
p2 |n1 ) = vd
n11
|n1
n1
vd
ar (n11 |n1 )
n1 p1 (1 p1 )
p1 (1 p1 )
=
=
2
2
n1
n1
n1
(3.17)
40
Figura 3.2: Distribuio dos indivduos sobre a rea A. representa os indivduos (animais)
na rea de estudo A. Apesar dos animais terem tendncia a agruparem-se, as vezes parte-se do
principio que estes seguem um processo de Poisson.
De uma forma aleatria, traam-se linhas rectas ao longo da rea (lj , tal que
P
lj = L). Cada uma dessas linhas, lj , ento percorrida de uma ponta outra,
xi = ri cos (i ) , (e Zi = ri cos (i ))
41
a)
b)
Figura 3.3: a) Trajectos lineares. b) Os objectos em cima da linha so observados e presupesse que os mais distantes da linha tem menor probabilidade de serem observados, tanto menor
quanto maior for a distncia.
Pressupostos do mtodo
Dado um espao de probabilidade (, A, P ) e um conjunto arbitrrio T , um processo estocstico uma funo real e finita X (t, ), definida no produto cartesiano T que para cada
fixo T , funo mensurvel ( no sentido de Borel) de . Neste caso o processo estocstico
representa um fenmeno aleatrio que evolui no espao, onde t (t (0, +)) representa o espao.
42
Figura 3.6: Vrias tentativas para a funo de deteco : A - Normal truncada , B - Uniforme,
C - Exponencial Negativa, D - Hazard-Rate, que depois de escolhida em funo da performance
de cada uma faz-se uma ajuste da funo deteco.
a linha L, o animal pode no ser detectado por diversas razes. Por exemplo,
pode-se encontar sobre a copa de uma rvore, debaixo de um tufo de ervas ou
num lago, fazendo com que tal pressuposto seja constantemente violado.
Normalmente, no mtodo de trajecto linear, para simplificar e tornar mais
cmodo o estudo, o experimentador estipula uma certa distncia mxima denominada por w, para a deteco dos animais. Aqueles que se encontrem para alm
da distncia estabelecida so simplesmente ignorados.
Uma outra possibilidade para a seleco dos dados , depois de observados
os indivduos, ignorar uma parte das distncias com menos frequncia. Certos
autores (Alldredge e Gates, 1985) aconselham uma reduo de 5 a 10% dos indivduos mais distantes do observador.
Uma funo truncada num dado intervalo (a, b) em que b > a, onde se exclui todos os valores que no pertencem ao intervalo tem a seguinte funo de
distribuio:
F (x) =
x (a,b]
0xa
F (x)F (a)
F(b)F(a)
a<xb
1x>b
F (x) =
x (a,b]
Rx
Rab
a
0xa
f (u)du
f (x)dx
x (a, b]
1x>b
45
f (x) =
x (a,b)
f (x)
a f (x)dx
Rb
x (a, b)
1xaexb
Assim, a funo deteco g (x) truncada no intervalo [0, w], que no uma
densidade de probabilidade, substituda por outra, f (), tal que:
xi (i = 1, 2, , n2 )
g (x) dx
0
com f (0) =
Rw
0
R wg(xi )
0 g(x)dx
46
Paralelamente linha recta L traam-se duas outras rectas, que distam da primeira
w unidades. Partindo do princpio que os pressupostos so respeitados, B1 -B5 ,
ao longo da rea de largura 2w os indivduos so detectados com o objectivo de
estimar a densidade populacional.
Assim, a densidade populacional estimada por:
= NT L
D
A
(3.18)
=
D
n2
2wL
p2
(3.19)
p2 =
Rw
0
g (x) dx
=
w
w
47
(3.20)
(3.21)
n2 w
.
T L
N
A
= 2 V ar NT L
A
48
Rw
g x| dx
0
g0
Rw
0
w
g x| dx
w
Rw
g0 g x| dx
g0
w
49
Buckland traduz o modelo por uma equao mais simples, mas tambm menos
realista, na qual a funo de verosimilhana condicionada a n2 :
n2
Y
i=1
g (xi )
Rw
g (x) dx
0
n2
Y
g (xi )
i=1
(3.22)
Ao longo dos tempos a funo para o mtodo de trajecto linear foi abordada de
diversas maneiras. Seber6 apresentou a funo de verosimilhana tendo em conta
que as distncias e o total de indivduos observados so variveis aleatrias.
6
Grande parte das pesquisas George A. F. Seber so sobre populaes abertas. O seu trabalho foi desenvolvido em conjunto com J. N. Darroch. Hoje uma dos altos dirigentes do
departamento de matemtica na universidade de Auckland.
50
L () = f (x1 , x2 , , xn2 , n2 )
= f (x1 , x2 , , xn2 |n2 ) f (n2 )
(Propriedade condicionada da funo densidade)
NT L n2
p2 (1 p2 )NT L n2
= f (x1 |n2 ) f (x2 |n2 ) f (xn2 |n2 )
n2
(Os n2 objectos tem funo de distribuio Binomial7 )
=
=
=
NT L n2
p2 (1 p2 )NT L n2
f (x1 |n2 ) f (x2 |n2 ) f (xn2 |n2 )
n2
g (x1 )
NT L n2
g (x1 )
g (xn2 )
Rw
Rw
p2 (1 p2 )NT L n2
Rw
g (x) dx 0 g (x) dx
g (x) dx n2
0
0
n
2
Y g (xi )
NT L n2
Rw
p2 (1 p2 )NT L n2
g (x) dx n2
i=1 0
n2
Y
g (xi ) NT L n2
p2 (1 p2 )NT L n2
L (x1 , x2 , , xn2 , n2 ) =
(3.23)
n
2
i=1
51
Rw
g x| dx
0
w
T L =
N
n2
p2
x, =
(3.24)
Rw
g x| dx e que tambm pode-se
0
1
g (x)
=
f (x)
f (x)
1
g (0)
=
f (0)
f (0)
portanto
T L = n2 f (0) w
N
52
De 3.18 e 3.19:
=
D
n2 f (0)
n2
n2
=
=
2wL
p2
2L
2L
= n2 f (0) 2Lw
T L = DA
/ = n2 f (0) w
N
2L
/
Da equao 3.24 consideram-se n2 e p2 como sendo variveis aleatrias e aplicando a tcnica do clculo da varincia utilizando uma aproximao da srie de
Taylor, temos que a varincia estimada da populao :
n2
T L = Vd
T L Vd
ar N
ar
Vd
ar N
p2
2
2
=
.Vd
ar (n2 ) +
.Vd
ar (
p2 )
Z1 z=Z
Z2 z=Z
1
Vd
ar (n2 ) n22 Vd
ar (
p2 )
=
+
2
4
p2
p2
!
Vd
ar (n2 ) Vd
ar (
p2 )
+
n22
p22
n2
= 22
p2
(3.25)
53
p2 ]
E [
p2 |n2 ] = E [
e a covarincia entre n2 e p2 nula, ento:
p2 |n2 ) , n2 )
cov (
p2 , n2 ) = cov ((
= E ((
p2 |n2 ) n2 ) E (
p2 |n2 ) E (n2 )
(definio da covarincia)
p2 |n2 ) n2 |n2 )) E [
p2 ] E (n2 )
= En2 (E ((
(propriedade da esperana condicionada)
p2 |n2 )) E [
p2 ] E (n2 )
= En2 (n2 E (
p2 ] E [
p2 ] E (n2 )
= E (n2 ) E [
= 0
A varincia de n2 pode ser estimada por diversas formas. Na altura da realizao da experincia, ao invs de se retirar uma nica amostra, tiram-se vrias e
ar (n2 ).
com base nisso obtm-se uma estimativa para a varincia emprica de n2 , Vd
Tambm com base nos conhecimentos duma experincia pode-se estimar a varincia de n2 atravs de mtodos computacionais utilizando, por exemplo, o mtodo
de Monte Carlo, Dias (1979).
Tendo em conta que os estimadores de mxima verosimilhana so assimptot
icamente normais, uma aproximao para a varincia p2 pode ser obtida pela
expresso 2.10.
54
g (x|) = ex , 0 < x w
ento temos que
p2 =
Rw
g x| dx
0
1
=
w
e
ew
Z
1 w x
1 x
1
=
e
e dx =
w 0
w
0
!
1
1
1 ew
+
=
h i2
h i2
0
0
p2
p2
|=
|=
2
2
E 2 ln L (|X) |=
2 ln L (|X) |=
2
2
we(w) 1 + ew
1 + ew
=
2
2
w2 n2 e2w + w2 ew + 2ew 1
V ar p2 |
(A dimenso da amostra n2 )
O modelo de trajecto linear acima abordado conduzido por um nico observador. Um modelo mais geral, que considera a deteco dos animais por vrios
observadores, foi proposto por Alpizar e Pollock (1996). Este modelo considerado mais realista (pois na realidade o observador ptimo no existe) e toma em
conta que as probabilidades de deteco so diferentes entre os observadores.
55
56
L () = LLP () LT L ()
(3.26)
em que:
- LLP (N, p1, p2 () |n11 , n10 , n01 ) a funo da mxima verosimilhana multinomial do modelo captura-recaptura;
- LT L (| (x1 , x2 , , xn2 ) , n2 ) a funo da mxima verosimilhana do modelo de trajectos lineares.
57
onde p2 () =
Rw
0
(3.27)
g (x|) dx
=
w
w
n10
n01 n11
58
LT L (| (x1 , x2 , , xn2 ) , n2 ) =
n2
Y
i=1
Rw
0
g (xi )
g (x|) dx
(3.29)
3.3.3. Estimao de N e g0
Sem perda de generalidade, seja a seguinte notao para a funo deteco definida
a menos da constante de proporcional g0 :
g (x|) = g0 g (x|)
(3.30)
p2 = g0
= g0 p2
w
(3.31)
p2 < p2
n11
,
n1
LP = n1 n2 = n2
N
n11
p2
(3.32)
p2 = p2
L () = L1LP () L2LP () LT L ()
e tendo em conta o lema de Chapman, ver Apndice A, obtem-se o seguinte
61
estimador para N:
MC =
N
n
p ()
p () = p1 + p2 p1 p2
semelhana dos outros casos, 3.15 e 3.25, uma estimativa para varincia do
MC , da populao pelo mtodo combinado obtm-se tendo em conta
estimador, N
3.11.
Seja (z1 , z2 ) =
z1
z2
n
,
p(
)
Z2 , temos que:
n
MC
Vd
ar
Vd
ar N
p
2
2
d
=
.V ar (n) +
.Vd
ar p
Z1 z=Z
Z2 z=Z
1
2
2d
Vd
ar (n) n V ar p
+
=
p2
p4
d
2
V
ar
p
n Vd
ar (n)
= 2
+
p ()
n2
2
p
62
2
2
2
(3.33)
A varincia impirca pode ser uma boa estimativa para V ar (n). Utilizando o
mtodo de Monte Carlo obtm-se Vd
ar (n) e recorrendo as propriedades da varincia e a aproximaes da srie de Taylor tem-se:
Vd
ar (
p) = Vd
ar (
p1 ) + Vd
ar p2 Vd
ar p1 p2
2
d
d
d
= V ar (
p1 ) + V ar p2 V ar (
p1 ) p2
p1 )2
Vd
ar p2 (
Para o clculo de Vd
ar (
p1 ) utiliza-se 3.16 e 2.10:
2
(1
)
p2
1
1
p1 (1 p1 ) d
+ V ar p2
Vd
ar (
p) =
n2
n2
2
d
V ar p2 (
p1 )
Uma estimativa para a varincia de p2 depende obviamente da funo de
deteco utilizada no modelo e para uma expresso para Vd
ar p2 , complexa
P
na maioria das vezes, recorre-se matriz varincia-covarincia .
Para estimar g0 integra-se ambos membros da equao 3.30:
63
g x| dx =
g0 g x| dx
(3.34)
p2
p2 n2
= =
p2
n2 p2
g0 =
T L ,
e tendo em conta 3.32, lembre-se que o estimador de 3.29 para N dado por N
g0 expressa por:
g0 =
T L
N
LP
N
LP e de N
T L , g0 aproximadamente 1.
Quando h pouca diferena entre N
LP , pois
T L maior do que N
Para fins prcticos no interessa os casos em que N
,
e
tem-se g0 > 1. A varincia de g0 expressa em funo das varincias de
dela prpria:
d
d
V ar (
g0 ) = V ar
))2
))2 + (CV (
= g02 (CV (
(3.35)
Atendendo que
(
) pode ser interpretado como
= wp2 (
= wp2 ) e
64
portanto:
p2 (1 p2 )
Vd
ar (
) = w2 Vd
ar (
p2 ) = w2
n1
ar (
p2 ) = w2
Vd
ar (
) = w2 Vd
e neste caso temos que h =
Rw
0
h i2
0
|=
h
2
2 ln L (|X) |=
g (x|
)dx
.
w
Vejamos agora que nem sempre facil obter uma expresso para uma estima-
n11
n1
dada por:
x2
g (x|) = e
,temos que
p2 =
Rw
g x| dx
Rw
x2
e dx
0
=
=
w
w p
p
w
w
erf
erf
=
' 0.88625
2w
w
0
65
onde
erf (x) =
R x t2
e dt
0
e portanto
g0 =
p2
n11
=
p2
n1
w
p .
w
0.88625 erf
66
observador.
O Quadro 3.2 apresenta os dados que aqui sero analisados e correspondem
s distncias das latas que foram detectadas pelo observador, num total de 202
observaes.
Quadro 3.2: Nova organizao dos dados de Otto
0.11 2.18 2.19 3.51 3.75 4.05 4.09 4.1 5.16 8.42 0.93 0.93 1.11 1.11 1.33 1.33 1.69 1.69 2.31
2.31 4.15 4.15 4.26 4.26 4.35 4.35 5.24 5.24 5.28 5.28 5.48 5.48 7.20 7.20 7.31 7.31 17.01
17.01 0.88 0.88 0.88 0.88 1.77 1.77 1.77 1.77 3.35 3.35 3.35 3.35 4.35 4.35 4.35 4.35 8.97
8.97 8.97 8.97 9.58 9.58 9.58 9.58 9.61 9.61 9.61 9.61 0.14 0.14 0.14 0.14 0.14 0.14 0.14 0.14
0.26 0.26 0.26 0.26 0.26 0.26 0.26 0.26 0.30 0.30 0.30 0.30 0.30 0.30 0.30 0.30 0.74 0.74 0.74
0.74 0.74 0.74 0.74 0.74 1.12 1.12 1.12 1.12 1.12 1.12 1.12 1.12 2.68 2.68 2.68 2.68 2.68 2.68
2.68 2.68 2.91 2.91 2.91 2.91 2.91 2.91 2.91 2.91 4.13 4.13 4.13 4.13 4.13 4.13 4.13 4.13 5.58
5.58 5.58 5.58 5.58 5.58 5.58 5.58 6.03 6.03 6.03 6.03 6.03 6.03 6.03 6.03 7.27 7.27 7.27 7.27
7.27 7.27 7.27 7.27 7.63 7.63 7.63 7.63 7.63 7.63 7.63 7.63 7.9 7.9 7.9 7.9 7.9 7.9 7.9 7.9 8.35
8.35 8.35 8.35 8.35 8.35 8.35 8.35 8.51 8.518.51 8.51 8.51 8.51 8.51 8.51 9.69 9.69 9.69 9.69
9.69 9.69 9.69 9.69 11.79 11.79 11.79 11.79 11.79 11.79 11.79 11.79
Depois de escolhida a funo, funo chave, que melhor se ajuste aos dados em
questo. altura de definir o nmero de termos de ajustamento da expanso de
srie que ajuste a funo chave s distncias. No programa Distance8 , a funo
de deteco definida pela seguinte frmula geral:
onde s
erie corresponde respectiva expanso de srie:
8
67
Funo chave
Metade da normal,
Expanso de srie
1
w
Coseno,
y2
Exponencial Negativa, e 22
Coseno,
Uniforme, e
Coseno,
aj
Pm
j=1
Pm
j=1
aj cos
aj cos
Pm
j=1 aj cos
jwy
w
jwy
w
jwy
w
y2
k (y) = e 2A(1)2
y
772.60 k (y) = e A(1)
1
930.24 k (y) = W
744.83
T L , p2 e
.
esto apresentados : N
9
y2
A funo metade da normal dada por g (y) = e 22 onde o parmetro que a define.
68
7.6410
0.3934 0.0515 [6.9038; 8.4570]
p2
0.3820
0.0197 0.0515 [0.3452; 0.4228]
T L
529.00
46.122 0.0872 [445.00; 628.00]
N
Apesar da funo metade da normal ser a que melhor se ajusta aos dados
apresentados no Quadro 3.2, a populao subreestimada com um enviesamento
relativo de 6.87%. A Figura 3.8 mostra que medida que afastamos da linha
L h cada vez menos latas observadas e as latas que se encontram sobre a linha
so observadas com probabilidade 1, como j era de se esperar. H uma grande
concentrao de latas na faixa compreendidade entre 4 a 10 metros da linha L.
Figura 3.8: Dados das distncias de latas de cervejas castanhas obtidas atraves da experincia
de Otto,1982.
Para exemplificar o modelo de captura-recaptura, vou utilizar parte da informao dos dados de Otto apresentado no Quadro 3.2.
A dimenso da populao das latas de cervejas 495. Do programa Distance
sei que p2 0.38, por parece razoavel considerar que p2 = 0.4 e sem perda de
generalidade, vou supor que p1 = 0.3. Atraves do programa Maple foi possvel
69
gerar uma binomial, Bin (N, p1 ), para o clculo de n1 (Apndice C- Quadro 5.1).
O Quadro 3.5 apresenta os resultados obtidos do programa PopSize para 149
indivduos marcados na primeira captura e 202 na recaptura. Para o clculo das
varincias de p1 e p2 , utilizei respectivamente as expresses 3.16 e 3.17.
Quadro 3.5: Estimao de Lincoln-Petersen ( PopSize)
p1
0.2970
se(
p1 ) 0.0321
p2
0.4027
se(
p2 ) 0.0401
se(NLP ) 41.964
A populao sobreestimada, pois para uma populao real de dimenso 495
LP %BIAS N
LP
N
1a captura 2a captura N
%BIAS
200
1000
10000
60
300
3004
79
499
4993
225.7
1108.9
10900.4
0.1285
0.1089
0.0900
220.8
1097.5
10905.2
0.1040
0.0975
0.0905
Robert
70
P.
Gengron.
Version
1.0.
[0.793,1.279]
20
=77.11,
g0 =1.05
71
0.4
e
p = p1 + p2 p1 p2
= 0.3 + 0.4 0.3 0.4
= 0.58
e portanto
MC = n = 291 = 501.7
N
p 0.58
LP , pois as pequenas diferenas
MC coincide com N
Pode considerarar-se que N
devem-se s aproximaes do programa utilizado, Maple. O parmetro g0 pode
LP :
T L e N
tambm ser estimado atravs da razo entre N
g0 =
T L
N
529.00
=
1.05
LP
501.63
N
72
4. Simulao
Como j se referiu atrs, muitas vezes para melhor se conhecer a realidade recorrese a construo de modelos. Um estudo preciso e rigoroso de um fenmeno pode
ser custoso ou mesmo impossvel de se realizar. Contudo para se ter alguma
garantia da robustez do modelo essencial fazer estudos sobre esse. sobretudo
necessrio conhecer o comportamento do modelo mediante um conjunto de dados e
parmetros diferentes. Para um melhor conhecimento do modelo recorre-se ento
a simulaes do mesmo, utilizando mtodos numricos por via computacional.
O Mtodo de Monte Carlo muito conveniente para tratamento destes
modelos.
O objectivo da simulao encontrar estimativas para os parmetros g0 , p1
e . Primeiro ser analisado o caso em que a funo de verosimilhana no
restringida para depois, com base nesses resultados estudar o caso restringido.
Para tal, consideraremos a funo de verosimilhana dada por 3.27 sugeito a:
0 < g0 < 1
73
(4.1)
0 < p1 , p2 < 1
(4.2)
Pns
= i=1 Xi
X
ns
(4.3)
74
Pns
2
X
x
i
V ar (X) = i=1
ns 1
(4.4)
a2ns
ansi
ans(k1)
ansk
Parmetros a estimar
Atendendo a 3.27 e que LLP = L1LP L2LP , o Lema de Chapman garante-nos que
= n , consultar o apndice B, uma estimativa vlida. Entretanto para se obter
N
p
p (= p1 + p2 () p1 p2 ()) necessrio estimar p1 e p2 ().
Portanto, para se ter uma estimativa da populao N basta estimar p1 e p2 (),
pois n (= n10 + n01 + n11 ) conhecido.
O parmetro p2 ()
Vejamos como obter uma estimativa de p2 (). A probabilidade de um animal
ser detectado dada em funo dos parmetros, que definem a funo deteco.
Uma vez que a funo de deteco se define como g (x|) = g0 g (x|) certo
que p2 () depende sempre do parmetro g0 e de outros que definem g (x| ) .
Aqui, sero considerados apenas os casos em a funo deteco e a normal ou
75
exponencial negativa, ambas truncadas em [0, w]. Tanto para um caso como para
o outro a funo deteco depende apenas do parmetro . O vector parmetro
que define p2 () ento dado por = (g0 , ).
Os parmetros g0 , p1 e
O parmetro (que define a funo deteco e por conseguinte p2 ), g0 e p1 so
estimados mediante ao mtodo de mxima verosimilhana utilizando a expresso
3.27. Da resoluo numrica dum sistema de trs equaes, em que a cada equao
corresponde a derivada parcial em ordem a g0 , p1 e respectivamente, obtm-se
uma estimativa para cada um dos parmetros.
Entretanto, para gerar amostras de nmeros aleatrios que traduzem as distncias xi (i = 1, 2, , n2 ) necessrio definir um valor para do qual se pretende
estimar.
Vejamos ento como calcular para o caso particular em que a funo deteco
a exponencial negativa . Por hiptese g0 = 1, p2 () = 0.4 e w = 20.
Seja
= 0
20
20
0
Rw
76
1
=
20
1 e20
1
1 e20
20
isto
0.4 =
1
1 e20 , > 0
20
(4.5)
e20 + 8 1 = 0
Uma vez resolvida (por mtodos numricos22 ) a equao 4.5 obtm-se um valor
de sigma, que neste caso aproximadamente 0.1116.
Procedimentos do mtodo
O primeiro passo a ser dado a definio dos parmetros hipteses do modelo.
H que se estipular valores para:
ns (numero de simulaes);
N (tamanho da populao) e w;
p1 e p2 ;
e em consequncia de p2 obtem-se um valor para .
De seguida, o objectivo obter n2 (= n01 + n11 ). Para tal gera-se uma multinomial com parmetros N, p1 e p2 .
semelhana do sistema de urna, geram-se nmeros aleatrios U seguindo
uma distribuio uniformes em (0, 1) (U (0, 1)) e de acordo com a probabilidade
22
77
78
g (x|) = ex
(4.6)
e
f (x) =
g (x|)
ex
= R w x =
e dx
0
79
ex
1
(1 ew )
w
1
0.8
0.6
0.4
0.2
10
x
15
20
x2
Figura 4.3: Grfico da funo deteco da Normal truncada em [0, 20]. g (x) = e , com
= 9.04296162.
considerou-se uma varivel contnua X, com funo densidade de probabilidade
definida em 4.6 e a funo de distribuio invertvel
F (x) =
f (t) dt
Y = F (x) =
1 ex
1
x
1
e
=
1 ew
/1 (1 ew )
/
80
h (y) =
dH (y)
= 1, y [0, 1]
dy
Y y U (0, 1)
81
Inversamente, se uma varivel Y segue uma distribuio U (0, 1), ento a varivel
= F 1 (y)
1
1
X = ln
1 y (1 ew )
82
p1 N
0.2 150
500
0.4 150
500
%BIAS
p2 = 0.2
LP
9.26
2.08
0.55
0.30
TL
0.91
0.19
0.50
0.05
MC
0.66
0.11
0.68
0.10
p2 = 0.4
LP
1.72
0.58
2.59
0.09
TL
1.63
0.98
0.93
1.10
p1 N
0.2 150
500
0.4 150
500
EQM
p2 = 0.2
LP
85.28
111.50
36.85
54.34
TL
MC
35.09 5.52
59.67 10.96
32.26 4.82
65.40 7.87
p2 = 0.4
LP
39.52
56.95
17.61
29.37
T L MC
23.11 4.85
35.04 8.31
23.14 4.50
41.70 7.34
MC
0.53
0.11
0.98
0.63
83
120
100
100
80
80
60
60
40
40
20
20
,210
,248
,229
,286
,267
,324
,305
,362
,343
,400
,381
,438
,419
,476
,457
,514
,495
,552
,533
,590
1,10
,571
1,86
1,48
2,62
2,24
3,38
3,00
4,14
3,76
4,90
4,52
b)
a) p1
Figura 4.5: O grfico da esquerda diz respeito ao parmetro e o da direita a p1 para 500
simulaes com N=150, p1 = 0.4 e p2 = 0.2.
1 o grfico deve ser muito parecido e os restantes casos em que g0 > 1 devem
concentrar em redor do valor 1.
120
100
80
60
40
20
0
,1
,3
,5
,7
,9
1,1
1,3
1,5
1,7
1,9
Figura 4.6: Distribuio de g0 , para 500 simulaes com N=150, p1 = 0.4 e p2 = 0.2.
85
Figura 4.7: Ilustrao do grfico do parmetro g0 caso a funo de verosimilhana seja restringida a g0 <1.
Quadro 4.3: Comparao de estimativas de teta para o caso em que g0 livre e g0=1
0 < g0 < 2
g0 = 1
g0 p1
p1
0.373
0.714
0.373
3.278
2.796
3.196 1.098 0.380
3.206 0.380
3.579 0.981 0.353
3.434 0.353
0.446
1.178
0.446
2.800
2.885
Figura 4.8: Grfico da funo de verosimilhana do modelo combinado com p1 =0.4, p2 =0.2,
=20.37, N=150 e a funo de deteco a normal truncada em [0, 20] .
86
5. Concluso
n2
p2 (
)
n2
p2
g0 =
T L
N
LP
N
mc .
bem como os parmetros: p1 e e consequentemente N
As propriedades dos estimadores so avaliados mediante ao uso da tcnica
de simulao Monte Carlo e se apresenta um exemplo ilustrativo para melhor
87
88
Apndices
Apndice A (Teoremas)
Na passagem de 3.3 para 3.5, L1LP obtm-se dividindo 3.3 por L2LP , isto :
N
n10 n01 n11
N [(1 p1 ) (1 p2 )]Nn
h in10 h in01 h in11
=
1
1
1
n
p
p
p
N n10 +n01 +n11
=
p
(1 p1 p2 + p1 p2 )Nn10 n01 n11
n
N n
=
p (1 p)Nn
n
= L1LP (N, p|n)
Tambm de uma forma anloga pode-se obter L2LP custa de 3.3 e L1LP .
Lema 14 (Chapman - 1951). Para qualquer p ( [0, 1]) dado,
= n (maior inteiro menor ou igual a n ) maximiza L (N, p), onde L (N, p|n) =
N
p
p
N n
Nn
p (1 p)
.
n
89
Se p =
e N
1 ambos maximizam L (N, p). Por outro lado N
o nico
ento N
mximo.
(Sanathan, 1972, pag. 144)
Estimar N:
> lnL:=ln(((N!)/(n!*(N-n)!))*(p^n)*((1-p)^(N-n)));
lnL := ln
N!pn (1 p)Nn
n! (N n)!
ans1 := (N + 1) (N n + 1) + ln(1 p)
> ans2 :=simplify(di(lnL,p)) ;
ans2 :=
n + pN
p(1 + p)
ans3 := {p = p, N =
90
n
}
p
ln (x) =
(x)
x
(x)
e (x) =
R
0
tz1 et dt.
(n10+n01+n12)!(p1(1p2) n10
lnL := ln
p1 +p2 p1 p2
(1p1)p2
p1 +p2 p1 p2
n01
p1p2
p1 +p2 p1 p2
> ans1:=simplify(di(lnL,p1));
ans1 :=
> ans2:=simplify(di(lnL,p2));
ans2 :=
> ans3:=solve({ans1=0,ans2=0},{p1,p2});
91
n11
ans3 := {p1 =
n11
n11
, p2 =
}
n01 + n11
n11 + n10
p1 =
n11
n11
e p2 =
n2
n1
Varincia de p2 ():
Atendendo que :
- g (x|) = ex ;
- ln L () =
Qn2
R g(xi )
i=1 ln w g(x)dx =
0
(1ew )
.
- p2 =
w
Pn2
i=1
xi n2 ln () + n2 ln ();
2
X
n2 wew n2
xi
+
ln L () =
w
i=1
2
(n2 w)2 ew n2
ln L () =
2
2
(1 ew )2
Apndice C (Simulaes)
Estimao de NMC utilizando os dados de Otto
92
>x := vector(202,[0.11, 2.18, 2.19, 3.51, 3.75, 4.05, 4.09, 4.1, 5.16, 8.42, 0.93, 0.93, 1.11,
1.11, 1.33, 1.33, 1.69, 1.69, 2.31, 2.31, 4.15, 4.15, 4.26, 4.26, 4.35, 4.35, 5.24, 5.24, 5.28, 5.28,
5.48, 5.48, 7.2, 7.2, 7.31, 7.31, 17.01, 17.01, 0.88, 0.88, 0.88, 0.88, 1.77, 1.77, 1.77, 1.77, 3.35,
3.35, 3.35, 3.35, 4.35, 4.35, 4.35, 4.35, 8.97, 8.97, 8.97, 8.97, 9.58, 9.58, 9.58, 9.58, 9.61, 9.61,
9.61, 9.61, 0.14, 0.14, 0.14, 0.14, 0.14, 0.14, 0.14, 0.14, 0.26, 0.26, 0.26, 0.26, 0.26, 0.26, 0.26,
0.26, 0.3, 0.3, 0.3, 0.3, 0.3, 0.3, 0.3, 0.3, 0.74, 0.74, 0.74, 0.74, 0.74, 0.74, 0.74, 0.74, 1.12, 1.12,
1.12, 1.12, 1.12, 1.12, 1.12, 1.12, 2.68, 2.68, 2.68, 2.68, 2.68, 2.68, 2.68, 2.68, 2.91, 2.91, 2.91 ,
2.91, 2.91, 2.91, 2.91, 2.91, 4.13, 4.13, 4.13, 4.13, 4.13, 4.13, 4.13, 4.13, 5.58, 5.58, 5.58, 5.58,
5.58, 5.58, 5.58, 5.58, 6.03, 6.03, 6.03, 6.03, 6.03, 6.03, 6.03, 6.03, 7.27, 7.27, 7.27, 7.27, 7.27,
7.27, 7.27, 7.27, 7.63, 7.63, 7.63, 7.63, 7.63, 7.63, 7.63, 7.63, 7.9, 7.9, 7.9, 7.9, 7.9, 7.9, 7.9, 7.9,
8.35, 8.35, 8.35, 8.35, 8.35, 8.35, 8.35, 8.35, 8.51, 8.51, 8.51, 8.51, 8.51, 8.51, 8.51, 8.51, 9.69,
9.69, 9.69, 9.69, 9.69, 9.69, 9.69, 9.69, 11.79, 11.79, 11.79, 11.79, 11.79, 11.79, 11.79, 11.79]):
>n10:=89.0:n01:=142.0:n11:=60.0:n2:=n11+n01;n:=n10+n01+n11:w:=20;n1:=n10+n11:
> p2:=(g0/w)*(int(exp(-((u^2)/teta)),u=0..w)):p:=p1+p2-p1*p2:
>odeN:=ln(495!) - (ln(n!)+ln((495-n)!)) + n*ln(p) + (495-n)*ln(1-p) + ln(n!) - (ln(n11!)
+ ln(n10!) + ln(n01!)) + n10*(ln(p1) + ln(1-p2) - ln(p)) + n01*(ln(p2) + ln(1-p1) - ln(p))
+ n11*(ln(p1) + ln(p2) - ln(p)) + n2*ln(1/(int(exp(-((u^2)/teta)),u=0..w))) + sum(ln(exp((((x[i])^2)/teta))),i=1..n2):
>ans1N:=di(odeN,g0):ans2N:=di(odeN,teta):ans3N:=di(odeN,p1):
>ans4N:=fsolve({ans1N=0,ans2N=0,ans3N=0},{g0,teta,p1},{g0=0.5..1.2,p1=0.1..0.5});
93
PROGRAMA MODCOMB
O programa tem como objetivo estimar o tamanho da populao usando o mtodo de monte
carlo em conjunto com o mtodo de mxima verosimilhana utilizando os seguintes estimadores:
Lincoln Petersen,Chapman, Trajecto Linear e por fim o do Modelo Combinado.
Depois de definidos os demais parmetros que definem os modelos, incluindo o nmero de
simulaes, estimam-se e comparam-se os diferentes estimadores.
INPUT
94
teta= matrix (numsim,1): g0cm:= matrix (numsim,1): pcm:= matrix (numsim,1): tcm:= matrix (numsim,1):tcm1:= matrix (numsim,1):
> ode1mc:=matrix(numsim,1):ans1Ncm:=matrix(numsim,1): ans2Ncm:=matrix(numsim,1):
ans3Ncm:=matrix(numsim,1): ans4Ncm:=matrix(numsim,1):Nmc:=matrix(numsim,1):
Definio de p2 ; e consequentemente p;
> p2:=(g0/w)*(int(exp(-((z^2)/teta)),z=0..w)):p:=p1+p2-p1*p2:
INCIO DO CICLO GERAL PARA APLICAO DO MTODO DE MONTE CARLO
> for j from 1 to numsim do
Este ciclo gera uma multinomial, onde N a populao e n11 , n10 , n01 e n00 so
variavis
> for k from 1 to N do
> unif[k]:=stats[random,uniform[0,1]](1):
> if (unif[k] > (p11*(1-p21)+p21*(1-p11)+p11*p21)) then n00[j,1]:=n00[j,1]+a[j,1] fi;
95
Clculo de n1 , n2 e n
> n1[j,1]:=n11[j,1]+n10[j,1];n2[j,1]:=n11[j,1]+n01[j,1];
> nw[j,1]:=n10[j,1]+n01[j,1]+n11[j,1];
96
> fi:
> od:
> Nmc[j,1]:=nw[j,1]/pwest[j,1]:
> Ntlest[j,1]:=simplify(nw[j,1]/pwest[j,1]):
98
99
100
Bibliografia
[1] Alldredge, J. R. e Gates, C. E. (1985).Line transect estimators for left truncated distributions. Biometrics, 41, Pag. 275-80.
[2] Alpzar-Jara, R. e Pollock, K.H. (1996). A combination line transect and
capture-recapture sampling model for multiple observers in aerial surveys.
Journal Env. Ecol. Stat. 3(4):311-327, www.home.uevora.pt/~alpizar.
[3] Alpzar-Jara, R. e Pollock, K.H. (1999). Combining line transect capturerecapture for mark-resighting studies. Marine Mammal Survey and Assessment Methods, ISBN 90 5809 043 4, www.home.uevora.pt/~alpizar.
[4] Begon, M. (1989). Ecologa animal-Modelos de cuantificacin de poblaciones.
Editorial trillas.
[5] Begon, M. (1979). Investigating Animal Abundance: capture-recapture for
biologists. Edward Arnold, England.
[6] Brownie, C., Anderson, D.R., Burnham, K.P. and Robson, D.S. (1985). Statistical inference from band recovery dataa handbook. U. S. Department
of Interior, Fish and Wildlife Service Resource Publication 156. 305 pp,
www.cnr.colostate.edu/~gwhite/software.html.
101
[7] Buckland, S. T., Anderson, D.R., Burnham, K.P. e Laake, J.L. (1993).
Distance sampling: Estimating Abundance of Biological Populations. Chapman&Hall, London, www.ruwpa.st.and.ac.uk/distancebook/.
[8] Burnham, Kenneth P. et al (1980). Estimation of density from line transect
sample of biological populations. Wildlife Monographs.
[9] Burnham, K. P. et al (1987). Design and analisis methods for fish surbival
expreriments basead on realease-recapture. American Fisheries Society Monograph 5, Betheasda,www.cnr.colostate.edu/~gwhite/software.html.
[10] Casella, G. e R. L. Berger (1990). Statistical inference. Duxbury, California.
[11] Constrained Maximum Likelihood. http://faculty.washington.edu
[12] Cormen, T. et al.. Introduction to algorithims. The MIT Press, Massachusetts.
[13] Dias, J. R. (1979). Aplicao do mtodo de Monte Carlo ao clculo dos valores
de . Barbosa&Xavier LDA, Evora.
[14] Efron, B. e D.V. Hinkley (1978). Assessing the accuracy of the maximum likelihood estimator: Observed versus expected Fisher information.
Biometrika, Vol. 65, n.o 4. Pag.457-87.
[15] Guimares, R. C. (1997). Estatstica. Ed. revista. McGraw-Hill, Portugal.
[16] Krebs, C. J. (1994). Ecology-The experimental Analysis of Distribution and
Abundance. Fourth ed. Harper Collins, New York. Pag.9-11
102
103