Professional Documents
Culture Documents
Resumo
Considerando um modelo de regresso exponencial para dados de tempo de vida com uma
covarivel x proposto por Feigl e Zelen (1965), ns utilizamos abordagem Bayesiana para
obter inferncia para a funo de sobrevivncia no tempo t0 e com um valor da covarivel
especicada x0 . Em inferncia Bayesiana a especicao da priori para os parmetros de
interesse pode ser complexa. Esta distribuio expressa o conhecimento ou ignorncia a respeito dos parmetros. Porm nem sempre fcil caracterizar ou formular tal distribuio. A
abordagem de priori de referncia introduzida por Bernardo (1979) e modicada por Berger
e Bernardo (1989, 1992a,b), considerado e mostrado produzir inferncias muito satisfatria. Neste trabalho ns ilustramos a metododlogia proposta considerando um conjunto de
dados reais introduzido por Feigl e Zelen (1965) e um estudo de simulao, onde estimao
e probabilidade de cobertura so considerados.
Palavra Chaves: Anlise de Referncia Bayesiana, Modelo de Regresso, Priori de Referncia, Sobrevivncia.
Introduo
A teoria para dados de sobrevivncia tem sido bastante desenvolvida com o objetivo
e Singpurwalla (1974), Clark (1975), Kalbeisch e Prentice (1980), Nelson (1982) e Lawless
(1982) (mais detalhes em Collet, 1994).
Esta metodologia permite determinar quais variveis afetam a forma da funo de risco
e obter estimativas desta funo para cada indivduo. A funo de sobrevivncia denida
como a probabilidade de uma observao (indivduo) sobreviver mais que um determinado
tempo t, ou seja, no falhar aps certo tempo. Atravs da curva de sobrevivncia pode-se
comparar, por exemplo, dois ou mais tratamentos. Assim, uma curva de sobrevivncia com
declive acentuado representa baixa taxa ou curto tempo de vida, enquanto uma curva com
aclive representa alta taxa ou longo tempo de vida. Este estudo envolve o acompanhamento
de unidades (indivduos) at a ocorrncia de algum evento de interesse, por exemplo, a falha
(morte) da unidade. Exemplos de tempos de falha incluem os perodos de vida de mquinas
industriais at a quebra e os tempos de sobrevivncia de pacientes em um estudo clnico at
a morte.
Muitas vezes, o objetivo da anlise de sobrevivncia est centrado no estudo da relao
entre o tempo de ocorrncia de um evento de interesse e as covariveis explicativas. Neste
contexto, modelos de regresso so utilizados para explicar a dependncia entre o tempo e
estas covariveis. A literatura apresenta vrias tcnicas apropriadas para a anlise de dados
desta natureza, tais como: tcnicas de regresso no-paramtrica (Miller, 1976; Buckley e
James, 1979 e Lawless, 1982) e paramtrica (Feigl e Zelen, 1965 e Lawless, 1982). Entre esses
modelos de regresso duas famlias de modelos so muito popular especialmente em aplicao
mdica: O modelo de risco proporcional para o tempo de vida T e o modelo de locao-escala
para o lgartmo de T (ver por exemplo, Lawless, 1982).
Um caso especial o qual pertence as duas classe de modelos de regresso dado pelo
modelo de Feigl e Zelen, (1965), assumindo uma distribuio exponencial para T . Para
o i-simo paciente, os autores trabalharam com a funo de densidade de probabilidade
exponencial na parametrizao f (ti ; i ) = i exp{i ti }, t > 0, considerando a seguinte
relao linear entre o tempo mdio de sobrevivncia e a covarivel x,
E[Ti ] =
1
= + xi .
i
(1)
(2)
(3)
A partir de (3) obtemos as funes de risco, h(t), e de sobrevivncia, S(t), dadas por,
1
,
1 e 2 x
S(t|1 , 2 , x) = exp
h(t|1 , 2 , x) =
t
1 e 2 x
(4)
1n
exp{2 n
x
n
X
ti
}.
1 exp 2 xi
i=1
(5)
n
X
i=1
ti
.
1 e 2 x i
(6)
(7)
n
n
X
1 X
l(1 , 2 )
ti xi e2 xi ;
=
xi +
2
1 i=1
i=1
n
l(1 , 2 )
n
2 X 2 xi
ti e
;
= 2 3
12
1 1 i=1
(8)
(9)
n
1 X 2 2 xi
l(1 , 2 )
t i xi e
;
=
22
1 i=1
(10)
n
l(1 , 2 )
1 X
= 2
ti xi e2 xi .
1 2
1 i=1
(11)
A matriz de informao de Fisher e sua inversa, construdas a partir das equaes (7) a
(11), so dadas, respectivamente, por
H(1 , 2 ) =
n
x
1
para x =
Pn
i=1
xi
H = H 1 (1 , 2 ) =
e s2 =
Pn
x)
i=1 (xi
n
n
x
1
n
12
Pn
2
i=1 xi
12
Pn
i=1
ns2
s12x
x2i
(12)
s12x
1
s2
(13)
o
n
S = exp t0 x
1 e 2 0
(14)
= 2 .
obtemos,
1 =
t0
log(S)ex0
2 = .
(15)
(1 ,2 )
(S,)
I(S, ) =
n(x0
x)
S log(S)
1
I (S, ) = I (S, ) =
n(x0
x)
S log(S)
n
S 2 (log(S))2
nx0 2nx0 x +
S log(S)(
xx0 )
P
2
n
x2 + n
i=1 xi
Pn
Pn
i=1
2
i=1 xi )
x2i
S log(S)(
xx0 )
P
2
n
x2 + n
i=1 xi
n
x2 +
1
P
n
i=1
x2i
Anlise de Referncia
A anlise de referncia produz inferncia Bayesiana objetiva no sentido de que a armao
inferencial depende somente do modelo assumido e dos dados observados. A teoria de informao estatstica usada para denir a priori de referncia como uma funo matemtica
5
que descreve a situao na qual os dados dominaro melhor o conhecimento a priori sobre
a quantidade de interesse. Esta metodologia foi introduzido por Bernardo (1979) e mais
adiante desenvolvido por Berger e Bernardo (1989, 1992a, 1992b, 1992c). Uma caracterstica
importante na abordagem de Berger - Bernardo para construir uma priori no-informativa o
tratamento diferenciado para os parmetros de interesse e os parmetros nuisance. Quando
existe um parmetro nuisance, devemos estabelecer uma parametrizao ordenada, com o
parmetro de interesse apontado. Neste trabalho, consideramos apenas o caso regular, onde
a normalidade assinttica da distribuio a posteriori conjunta poder ser estabelecida.
Preposio 3.1: Seja p(x|, ), (, ) R R um modelo de probabilidade
com dois parmetros e , assumindo valores em R, sendo o parmetro de interesse e
o parmetro nuisance. Considere H(, ) a matriz de informao de Fisher em termos de
e e S(, ) = H 1 (, ). A distribuio a posteriori de (, ) assintoticamente normal
)
e matriz de covarincia
com mdia dada pelos estimadores de mxima verossimilhana (,
).
Segue que
S(,
1. a funo a priori de referencia condicional de dado
(|) h22 (, )1/2 ,
()
h22 (, )1/2
d, i ()
h (, )1/2
i () 22
l=1
Sob condies de regularidade (ver Bernardo, 2005 e Berger et al., 2005) a priori de
referncia pode ser reescrita como o produto de duas funes de parmetros independentes,
como segue.
Corolrio 3.1: Se o espao do parmetro nuisance () = independente de , e a
1/2
3.1
Para o modelo (3), considere 1 como parmetro de interesse e 2 como parmetro nuisance, a matriz de informao de Fisher H(1 , 2 ) e a inversa H (1 , 2 ) dadas respectivamente
em (12) e (13). Usando o Corolrio 3.1, a distribuio a priori de referncia condicional
para 2 dado 1 (2 | 1 ) = g2 (2 ) 1 e a distribuio a priori marginal para 1
(1 ) = f1 (1 )
1
.
1
1
.
1
(16)
A distribuio a posteriori de referncia conjunta construda a partir da funo de verossimilhana (5) e da funo a priori de referncia conjunta para 1 e 2 (16), dada por,
(
)
n
1 X 2 xi
1
x 2
ti e
.
(17)
(1 , 2 |t, x) (n+1) exp n
1 i=1
1
A partir de (17) obtemos as distribuies a posteriori condicionais para 1 e 2 , dadas
respectivamente por,
(1 |2 , t, x)
1
(n+1)
n
1 X 2 xi
ti e
exp
1 i=1
e
n
1 X 2 xi
ti e
(2 |1 , t, x) exp n
x 2
1 i=1
3.2
1
.
S log(S)
(18)
0.4
0.6
0.8
1
t0
Pn
i=1 ti e
(xi x0 )
"
nx0
n
X
xi
i=1
! #
, 0 S 1 e .
"
nx0
n
X
i=1
xi
! #
(19)
Um Estudo de Simulao
O estudo de simulao foi realizado com diferentes tamanho de amostras n = 30, 50, 100
e 200. Para a gerao dos tempos utilizamos o mtodo da funo inversa xando 1 = 80 e
2 = 0, 5. Para cada um dos tamanhos amostrais, obtivemos amostras com 100.000 iteraes
das distribuies a posteriori marginais de 1 e 2 utilizando o algoritmo de MetropolisHastings (Gamerman e Lopes, 2002).
Os resultados apresentados na Tabela 1 foram baseados em cadeias geradas com 100.000,
iteraes, com burn in de 5.000 e salto igual a 10, resultando em uma amostra com 9.500
iteraes. A convergncia foi vericada utilizando o mtodo de Geweke (1992).
Tabela 1: Resumos a posteriori para 1 e 2 .
1
Mdia
DP
IC-95%
Mdia
DP
IC-95%
30
88, 94
13, 03
0, 420
0, 143
50
87, 86
10, 01
0, 497
0, 112
100
77, 18
7, 85
0, 480
0, 098
200
81, 81
6, 07
0, 507
0, 067
Mdia
DP
IC-95%
Mdia
DP
IC-95%
30
0, 249
0, 056
0, 418
0, 137
50
0, 231
0, 043
0, 497
0, 109
100
0, 192
0, 036
0, 481
0, 096
200
0, 206
0, 025
0, 505
0, 066
Prob. de Cobertura
Amplitude
30
0, 9562
60, 5873
0, 9227
0, 7763
50
0, 9544
46, 2565
0, 9544
0, 5838
100
0, 9519
32, 0341
0, 9541
0, 3982
200
0, 9671
22, 4740
0, 9574
0, 2815
10
4.1
Prob. de Cobertura
Amplitude
30
0, 9473
0, 2516
0, 9452
0, 7750
50
0, 9431
0, 1963
0, 9343
0, 5798
100
0, 9413
0, 1401
0, 9608
0, 4059
200
0, 9502
0, 1001
0, 9653
0, 2812
tempo
WBC/10.000
tempo
0,230
65
0,700
143
0,075
156
0,940
56
0,430
100
3,200
26
0,260
134
3,500
22
0,600
16
10,000
1,050
108
10,000
1,000
121
5,200
1,700
10,000
65
0,540
39
contagem de glbulos brancos com 10.000 unidades e 2 representa o ganho no tempo mdio
de sobrevivncia correspondente a um acrscimo no percentual da contagem de glbulos
brancos.
Analogamente ao estudo de simulao, construmos as cadeias a partir da distribuio a
posteriori. Considerando um tempo de aproximadamente dois anos (t0 = 96), a funo de
sobrevivncia em pacientes com a contagem de glbulos brancos igual a 50.000 unidades
).
dada por S = exp ( 196
52
As medidas resumo para os parmetros 1 e 2 e para S e so apresentadas, respectivamente, nas Tabelas 6 e 7.
Tabela 6: Resumos a posteriori para 1 e 2 .
Mdia
DP
IC-95%
Geweke
86,3200
16,9887
[ 56,9355 ; 123,4608 ]
-0,0875
-0,1537
0,0418
[-0,2318 ; -0,0683]
0,5172
DP
IC-95%
Geweke
0,0858
0,0389
[ 0,0228 ; 0,1707]
-1,5860
-0,1572
0,0430
[-0,2414 ; -0,0739]
-1,3310
Concluso
Neste trabalho consideramos o modelo de Regresso de Feigl e Zelen (1965), onde con-
mtodo para obteno de uma distribuio a priori no informativa e produz inferncia bayesiana propria para o problema de regresso exponencial. O mtodo MCMC foi utilizado para
obteno das posteriori marginais.
Com os dados simulados, vericamos a adequabilidade do modelo, sendo que os resultados
encontrados foram satisfatrios. Tambm consideramos um conjunto de dados reais proposto
por Feigl e Zelen (1965) para ilustrar a metodologia proposta.
Finalmente importante enfatizar que sumarizamos a derivao da distribuio a posteriori de referncia para o caso de dois parmetros, o qual fornece solues bayesiana para
problemas que no tem uma priori subjetiva. Isto tem sido um assunto polmico entre muitos estatsticos, a escolha responsvel e cuidadosa de uma priori no subjetiva pode ser uma
melhor alternativa. Alm disso, esta metodologia generaliza algumas alternativas propostas
anteriormente, como por exemplo a distribuio a priori de Jereys
Referncias Bibliogrficas
1. Berger, J. O. and Bernardo, J. M. (1989). Estimating a product of means: Bayesian
analysis with reference priors. J. Amer. Statist. Assoc. 84, 200207.
2. Berger, J. O. and Bernardo, J. M. (1992a). Ordered group reference priors with applications to a multinomial problem. Biometrika 79, 2537.
3. Berger, J. O. and Bernardo, J. M. (1992b). Reference priors in a variance components
problem. Bayesian Analysis in Statistics and Econometrics (P. K. Goel and N. S.
Iyengar, eds.) Berlin: Springer, 323340.
4. Berger, J. O. and Bernardo, J. M. (1992c). On the development of reference priors.
Bayesian Statistics 4 (J. M. Bernardo, J. O. Berger, A. P. Dawid and A. F. M. Smith,
eds.) Oxford: University Press, 3560 (with discussion).
5. Berger J. O., Bernardo J. M. Sun D. (2008). The formal denition of reference priors.
Submitted of Annals of Statistics 36.
6. Berger, J. O., Bernardo, J. M. and Sun, D. (2005). Reference priors from rst principles:
A general denition. Tech. Rep., SAMSI, NC, USA.
13
22. Miller, R. G., Least squares regression with censored data. Biometrika 63 pp. 449-464,
1976.
23. R Development Core Team, R: A Language and Environment for Statistical Computing, R Foundation for Statistical Computing, Vienna, Austria, URL: http://www.Rproject.org/ 2010.
24. Tibshirani, R., Noninformative priors for one patameter of many, Biometrika 76, pp.
604-608, 1989.
25. Zippin, C.; Armitage, P. Use of concomitant variables and incomplete survival information in the estimation of an exponential survival parameter, Biometrics, pp. 665-672,
1966.
26. Weibull, W., A statistical distribution of wide applicability, Journal of Applied Mechanics, Vol. 18, pp. 293-297, , 1951.
15