Inferencia Bayesiana

Estimao Bayesiana Objetiva do Modelo de
Regresso de Feigl e Zelen
Teresa Cristina Martins Dias

Vera Lucia D. Tomazella
Eder Angelo Milani
DEs - Universidade Federal de So Carlos
Resumo
Considerando um modelo de regresso exponencial para dados de tempo de vida com uma
covarivel x proposto por Feigl e Zelen (1965), ns utilizamos abordagem Bayesiana para
obter inferncia para a funo de sobrevivncia no tempo t0 e com um valor da covarivel
especicada x0 . Em inferncia Bayesiana a especicao da priori para os parmetros de
interesse pode ser complexa. Esta distribuio expressa o conhecimento ou ignorncia a respeito dos parmetros. Porm nem sempre fcil caracterizar ou formular tal distribuio. A
abordagem de priori de referncia introduzida por Bernardo (1979) e modicada por Berger
e Bernardo (1989, 1992a,b), considerado e mostrado produzir inferncias muito satisfatria. Neste trabalho ns ilustramos a metododlogia proposta considerando um conjunto de
dados reais introduzido por Feigl e Zelen (1965) e um estudo de simulao, onde estimao
e probabilidade de cobertura so considerados.
Palavra Chaves: Anlise de Referncia Bayesiana, Modelo de Regresso, Priori de Referncia, Sobrevivncia.
Introduo
A teoria para dados de sobrevivncia tem sido bastante desenvolvida com o objetivo
de estudar a funo de risco/sobrevivncia de um paciente ou sistema e aplicaes podem

ser encontradas nas mais diversas reas, tais como, biologia, medicina, cincias sociais e
engenharias. Na rea mdica, este estudo denominado anlise de sobrevivncia e na rea
industrial denominado anlise de conabilidade. Uma introduo s tcnicas usadas em
anlise de dados de sobrevivncia pode ser encontrada em Armitage e Berry (1987) e Altman
(1991). Muitos textos apareceram nas dcadas de 70 e 80, como por exemplo, Mann Schaer
1
e Singpurwalla (1974), Clark (1975), Kalbeisch e Prentice (1980), Nelson (1982) e Lawless
(1982) (mais detalhes em Collet, 1994).
Esta metodologia permite determinar quais variveis afetam a forma da funo de risco
e obter estimativas desta funo para cada indivduo. A funo de sobrevivncia denida
como a probabilidade de uma observao (indivduo) sobreviver mais que um determinado
tempo t, ou seja, no falhar aps certo tempo. Atravs da curva de sobrevivncia pode-se
comparar, por exemplo, dois ou mais tratamentos. Assim, uma curva de sobrevivncia com
declive acentuado representa baixa taxa ou curto tempo de vida, enquanto uma curva com
aclive representa alta taxa ou longo tempo de vida. Este estudo envolve o acompanhamento
de unidades (indivduos) at a ocorrncia de algum evento de interesse, por exemplo, a falha
(morte) da unidade. Exemplos de tempos de falha incluem os perodos de vida de mquinas
industriais at a quebra e os tempos de sobrevivncia de pacientes em um estudo clnico at
a morte.
Muitas vezes, o objetivo da anlise de sobrevivncia est centrado no estudo da relao
entre o tempo de ocorrncia de um evento de interesse e as covariveis explicativas. Neste
contexto, modelos de regresso so utilizados para explicar a dependncia entre o tempo e
estas covariveis. A literatura apresenta vrias tcnicas apropriadas para a anlise de dados
desta natureza, tais como: tcnicas de regresso no-paramtrica (Miller, 1976; Buckley e
James, 1979 e Lawless, 1982) e paramtrica (Feigl e Zelen, 1965 e Lawless, 1982). Entre esses
modelos de regresso duas famlias de modelos so muito popular especialmente em aplicao
mdica: O modelo de risco proporcional para o tempo de vida T e o modelo de locao-escala
para o lgartmo de T (ver por exemplo, Lawless, 1982).
Um caso especial o qual pertence as duas classe de modelos de regresso dado pelo
modelo de Feigl e Zelen, (1965), assumindo uma distribuio exponencial para T . Para
o i-simo paciente, os autores trabalharam com a funo de densidade de probabilidade
exponencial na parametrizao f (ti ; i ) = i exp{i ti }, t > 0, considerando a seguinte
relao linear entre o tempo mdio de sobrevivncia e a covarivel x,
E[Ti ] =
1
= + xi .
i
Para dados no censurados, os autores introduziram o modelo log-linear no qual

1
= exp{xi }
i
e, Zippin e Armitage (1966) estenderam a anlise para dados censurados.
2
(1)
Neste trabalho, o interesse est em estimar a funo de sobrevivncia, assumindo que

os tempos de vida de pacientes sob estudo (Feigl e Zelen, 1965) seguem uma distribuio
exponencial e a relao dada na expresso (1). Para estimar os parmetros envolvidos,
utilizamos a metodologia Bayesiana objetiva introduzida por Bernardo (1979) e mais adiante
desenvolvida por Berger e Bernardo (1989, 1992a, 1992c), sendo considerada um mtodo
para encontrar uma distribuio a posteriori objetiva. A teoria de informao estatstica
usada para denir a distribuio a priori de referncia, como uma funo matemtica que
descreve a situao em que os dados dominaro o conhecimento a priori sobre a quantidade
de interesse.
Este trabalho est organizado da seguinte forma. Na Seo 2 apresentamos o modelo
de regresso exponencial proposto por Feigl e Zelen (1965). Na Seo 3, descrevemos a
construo da priori de referncia para o caso de dois parmetros e mostramos a construo
das distribuio a priori de referncia para o modelo estudado. Na Seo 4 ilustramos a
teoria, sob a abordagem Bayesiana, com um estudo de simulao e uma aplicao com dados
reais. As concluses so apresentadas na Seo 5.
Modelo de Regresso de Feigl e Zelen

Seja T uma varivel aleatria no negativa denotando os tempos de sobrevivncia, com
distribuio exponencial cuja funo de densidade de probabilidade dada por:

t
1
,
f (t | ) = exp
(2)
sendo t 0 e > 0 o parmetro desconhecido representando a taxa de falha constante. A
partir de (2), o tempo mdio de sobrevivncia dado por E(T ) = .

Utilizando o modelo (1), proposto por Feigl e Zelen (1965), tal que = 1 e2 x , 1 > 0 e
< 2 < , a funo de densidade de probabilidade (2) para a nova parametrizao
dada por,

t
1
exp 2 x .
f (t|1 , 2 , x) =
1 e 2 x
1 e
(3)
A partir de (3) obtemos as funes de risco, h(t), e de sobrevivncia, S(t), dadas por,
1
,
1 e 2 x

S(t|1 , 2 , x) = exp
h(t|1 , 2 , x) =
t
1 e 2 x
(4)
A funo de verossimilhana para os parmetros do modelo (3) dada por,

L(1 , 2 ) =
1n
exp{2 n
x
n
X
ti
}.
1 exp 2 xi
i=1
(5)
e, denotando l(1 , 2 ) = log(L(1 , 2 )) encontramos,

l(1 , 2 ) = n log [1 ] 2 n
x
n
X
i=1
ti
.
1 e 2 x i
(6)
As primeiras e segundas derivadas para os parmetros 1 e 2 , obtidas de (6) so,

n
l(1 , 2 )
n
1 X 2 xi
ti e
;
= + 2
1
1 1 i=1
(7)
n
n
X
1 X
l(1 , 2 )
ti xi e2 xi ;
=
xi +
2
1 i=1
i=1
n
l(1 , 2 )
n
2 X 2 xi
ti e
;
= 2 3
12
1 1 i=1
(8)
(9)
n
1 X 2 2 xi
l(1 , 2 )
t i xi e
;
=
22
1 i=1
(10)
n
l(1 , 2 )
1 X
= 2
ti xi e2 xi .
1 2
1 i=1
(11)
A matriz de informao de Fisher e sua inversa, construdas a partir das equaes (7) a
(11), so dadas, respectivamente, por
H(1 , 2 ) =
n
x
1
para x =
Pn
i=1
xi
H = H 1 (1 , 2 ) =
e s2 =
Pn
x)
i=1 (xi
n
n
x
1
n
12
Pn
2
i=1 xi
12
Pn
i=1
ns2
s12x
x2i
(12)
s12x
1
s2
Os parmetros do modelo de Feigl e Zelen (1965), assim como a funo de sobrevivncia,

podem ser estimados utilizando as matrizes H e H dadas em (12) e (13), respectivamente.
Como o interesse est em estimar a funo de sobrevivncia (4), especicamente em t0 e
x0 , a funo de sobrevivncia, neste cenrio, escrita da seguinte forma,

t
S(t0 ) = P [T > t0 ] = exp 2 x0 .
1 e
4
(13)
Chamando S(t0 ) = S e considerando a reparametrizao,
o
n
S = exp t0 x
1 e 2 0
(14)
= 2 .
obtemos,
1 =
t0
log(S)ex0
2 = .
Para o modelo (3) e a reparametrizao dada em (14), a funo de verossimilhana para

S e dada por,
#
n
X
log(S)
n
L(S, ) = tn
)] exp
ti exp((x0 xi )) .
0 [log(S)] exp[n(x0 x
t0 i=1
"
(15)
A matriz de informao de Fisher em termos dos parmetros S e pode ser obtida da

seguinte forma,
I(S, ) = J t H(1 , 2 )J
sendo J =
(1 ,2 )
(S,)
o jacobiano da transformao inversa. Assim, possvel escrever a matriz
de informao de Fisher e sua inversa, dadas respectivamente por,
I(S, ) =
n(x0
x)
S log(S)
1
I (S, ) = I (S, ) =
n(x0
x)
S log(S)
n
S 2 (log(S))2
nx0 2nx0 x +
S 2 (log(S))2 (nx0 (x0 2

x)+
P
2
n(n
x2 n
x
i=1 i )
S log(S)(
xx0 )
P
2
n
x2 + n
i=1 xi
Pn
Pn
i=1
2
i=1 xi )
x2i
S log(S)(
xx0 )
P
2
n
x2 + n
i=1 xi
n
x2 +
1
P
n
i=1
x2i
Anlise de Referncia
A anlise de referncia produz inferncia Bayesiana objetiva no sentido de que a armao
inferencial depende somente do modelo assumido e dos dados observados. A teoria de informao estatstica usada para denir a priori de referncia como uma funo matemtica
5
que descreve a situao na qual os dados dominaro melhor o conhecimento a priori sobre
a quantidade de interesse. Esta metodologia foi introduzido por Bernardo (1979) e mais
adiante desenvolvido por Berger e Bernardo (1989, 1992a, 1992b, 1992c). Uma caracterstica
importante na abordagem de Berger - Bernardo para construir uma priori no-informativa o
tratamento diferenciado para os parmetros de interesse e os parmetros nuisance. Quando
existe um parmetro nuisance, devemos estabelecer uma parametrizao ordenada, com o
parmetro de interesse apontado. Neste trabalho, consideramos apenas o caso regular, onde
a normalidade assinttica da distribuio a posteriori conjunta poder ser estabelecida.
Preposio 3.1: Seja p(x|, ), (, ) R R um modelo de probabilidade
com dois parmetros e , assumindo valores em R, sendo o parmetro de interesse e
o parmetro nuisance. Considere H(, ) a matriz de informao de Fisher em termos de
e e S(, ) = H 1 (, ). A distribuio a posteriori de (, ) assintoticamente normal
)
e matriz de covarincia
com mdia dada pelos estimadores de mxima verossimilhana (,
).
Segue que
S(,
1. a funo a priori de referencia condicional de dado
(|) h22 (, )1/2 ,
()
2. se (|) no prpria, uma aproximao compacta {i (), i = 1, 2, } para ()

necessria e a priori de referncia de dado dada por
i (|) = R
h22 (, )1/2
d, i ()
h (, )1/2
i () 22
3. dentro de cada i (), a funo a priori de referncia marginal de obtida por,

Z
h
i
1/2
i () exp
i (|) log s11 (, ) d
i ()
sendo s11 (, ) = h (, ) = h11 h12 h1

22 h21
1/2
4. a distribuio a posteriori de referncia de dado os dados {x1 , , xn }

( n
(Z
)
)
Y
(|x1 , , xn ) ()
(xl |, ) (|)d .
()
l=1
A justicativa eurstica desta proposio pode ser vista em Bernardo (2005).
Sob condies de regularidade (ver Bernardo, 2005 e Berger et al., 2005) a priori de
referncia pode ser reescrita como o produto de duas funes de parmetros independentes,
como segue.
Corolrio 3.1: Se o espao do parmetro nuisance () = independente de , e a
1/2
funes s11 (, ) e h22 (, ) fatoriza na forma

1/2
{s11 (, )}1/2 = f1 ()g1 () e {h22 (, )}1/2 = f2 ()g2 (),

ento,
() f1 () e (|) g2 () ,
a funo a priori de referncia relativa ao parmetro ordenado (, ) dada por
(, ) = f1 () g2 ()
e nesse caso no existe a necessidade de uma aproximao compacta, mesmo se a priori de
referncia no for propria (Bernardo e Smith, 1994).
Prova: Ver Teorema 12 em Bernardo (2005)
3.1
Inferncia para os parmetros do modelo
Para o modelo (3), considere 1 como parmetro de interesse e 2 como parmetro nuisance, a matriz de informao de Fisher H(1 , 2 ) e a inversa H (1 , 2 ) dadas respectivamente
em (12) e (13). Usando o Corolrio 3.1, a distribuio a priori de referncia condicional
para 2 dado 1 (2 | 1 ) = g2 (2 ) 1 e a distribuio a priori marginal para 1
(1 ) = f1 (1 )
1
.
1
Assim a distribuio a priori de referncia conjunta para 1 e 2

(1 , 2 )
1
.
1
(16)
A distribuio a posteriori de referncia conjunta construda a partir da funo de verossimilhana (5) e da funo a priori de referncia conjunta para 1 e 2 (16), dada por,
(
)
n
1 X 2 xi
1
x 2
ti e
.
(17)
(1 , 2 |t, x) (n+1) exp n
1 i=1
1
A partir de (17) obtemos as distribuies a posteriori condicionais para 1 e 2 , dadas
respectivamente por,
(1 |2 , t, x)
1
(n+1)
n
1 X 2 xi
ti e
exp
1 i=1
e
n
1 X 2 xi
ti e
(2 |1 , t, x) exp n
x 2
1 i=1
3.2
Inferncia para a funo de sobrevivncia do modelo
Considerando a reparametrizao dado em 14, onde S e so os parmetros de interesse

1
e nuisance, respectivamente e o corolrio 3.1, temos que (S) = f1 (S) S log(S)
e (|S) =
g2 () 1. Portanto, a distribuio a priori conjunta para S e

(S, )
1
.
S log(S)
(18)
A Figura 1 mostra o comportamento da funo a priori de referncia para o parmetro

S.
@SD
120
100
80
60
40
20
0.2
0.4
0.6
0.8
Figura 1: Funo a priori de referncia para S.

A distribuio a posteriori de referncia conjunta para S e , construda a partir da funo
de verossimilhana dada em (15) e da funo a priori de referncia conjunta dada em (18)
dada por,
(S, |t, x) S A()1 ( log(S))n1 exp
para A() =
1
t0
Pn
i=1 ti e
(xi x0 )
"
nx0
n
X
xi
i=1
! #
, 0 S 1 e .
As distribuies a posteriori condicionais para S e so dadas respectivamente por,

(S|, t, x) S A()1 ( log(S))n1
e
(|S, t, x) S A()1 exp
"
nx0
n
X
i=1
xi
! #
(19)
A distribuio a posteriori marginal, encontrada integrando a densidade a posteriori

conjunta dada em (19) com relao aos demais parmetros. O mesmo procedimento aplicado
para 1 e 2 . A soluo analtica para estas equaes obtida integrando as expresses;
porm tais integraes so complexas. Logo, o mtodo MCMC (Gamerman e Lopes, 2002)
utilizado para, a partir da distribuio a posteriori conjunta, obtermos as estimativas para
os parmetros de interesse.
Para ilustrar a metodologia, apresentamos um estudo com dados simulados e uma aplicao com dados reais (Fiegl e Zelen, 1965). Os resultados foram obtidos no software R
Development Core Team (2010).
Um Estudo de Simulao
O estudo de simulao foi realizado com diferentes tamanho de amostras n = 30, 50, 100
e 200. Para a gerao dos tempos utilizamos o mtodo da funo inversa xando 1 = 80 e
2 = 0, 5. Para cada um dos tamanhos amostrais, obtivemos amostras com 100.000 iteraes
das distribuies a posteriori marginais de 1 e 2 utilizando o algoritmo de MetropolisHastings (Gamerman e Lopes, 2002).
Os resultados apresentados na Tabela 1 foram baseados em cadeias geradas com 100.000,
iteraes, com burn in de 5.000 e salto igual a 10, resultando em uma amostra com 9.500
iteraes. A convergncia foi vericada utilizando o mtodo de Geweke (1992).
Tabela 1: Resumos a posteriori para 1 e 2 .
1
Mdia
DP
IC-95%
Mdia
DP
IC-95%
30
88, 94
13, 03
[67, 27 ; 117, 78]
0, 420
0, 143
[0, 699 ; 0, 142]
50
87, 86
10, 01
[70, 52 ; 109, 57]
0, 497
0, 112
[0, 717 ; 0, 275]
100
77, 18
7, 85
[63, 42 ; 94, 28]
0, 480
0, 098
[0, 674 ; 0, 289]
200
81, 81
6, 07
[71, 08 ; 93, 96]
0, 507
0, 067
[0, 636 ; 0, 376]
Considerando que o interesse est na funo de sobrevivncia, para os mesmos conjuntos

de dados gerados, obtivemos uma amostra das distribuies a posteriori marginais de S e
100
= 0.20 e
, para cada n, no tempo t0 = 100 e no valor x0 = 0, 5, onde S = exp 80e
1
9
= 0.5. As estimativas para os parmetros S e so mostradas na Tabela 2.

Tabela 2: Resumos a posteriori para S e .
S
Mdia
DP
IC-95%
Mdia
DP
IC-95%
30
0, 249
0, 056
[0, 148 ; 0, 370]
0, 418
0, 137
[0, 697 ; 0, 149]
50
0, 231
0, 043
[0, 153 ; 0, 320]
0, 497
0, 109
[0, 710 ; 0, 288]
100
0, 192
0, 036
[0, 127 ; 0, 268]
0, 481
0, 096
[0, 671 ; 0, 296]
200
0, 206
0, 025
[0, 159 ; 0, 259]
0, 505
0, 066
[0, 635 ; 0, 374]
Observamos pelas Tabelas 1 e 2 que para tamanho de amostra pequeno ou moderado as

estimativas esto razoveis; porm, as estimativas dos parmetros cam mais prximas dos
verdadeiros valores quando aumentamos o tamanho da amostra. Este fato ocorre para todos
os parmetros.
Calculamos a probabilidade de cobertura e o tamanho do intervalo de conana, para
os diversos tamanhos de amostra, para os parmetros 1 e 2 ou S e (Tabelas 3 e 4).
Observamos nestas tabelas que a probabilidade de cobertura aumenta e os amplitude dos
intervalos de credibilidade diminui com o aumento do tamanho da amostra. Notamos que os
resultados encontrados para 2 e esto muito prximos, indicando que a escolha de estimar
S ou 1 no afeta na estimao do outro parmetro.
Tabela 3: Probabilidade de cobertura e Amplitude do IC para 1 e 2 .
1
n
Prob. de Cobertura Amplitude
Prob. de Cobertura
Amplitude
30
0, 9562
60, 5873
0, 9227
0, 7763
50
0, 9544
46, 2565
0, 9544
0, 5838
100
0, 9519
32, 0341
0, 9541
0, 3982
200
0, 9671
22, 4740
0, 9574
0, 2815
10
Tabela 4: Probabilidade de cobertura e Amplitude do IC para S e .

S
n
4.1
Prob. de Cobertura Amplitude
Prob. de Cobertura
Amplitude
30
0, 9473
0, 2516
0, 9452
0, 7750
50
0, 9431
0, 1963
0, 9343
0, 5798
100
0, 9413
0, 1401
0, 9608
0, 4059
200
0, 9502
0, 1001
0, 9653
0, 2812
Aplicao com os Dados de Feigl e Zelen
Os dados de Feigl e Zelen (1965) consistem de tempos de sobrevivncia (em semanas)

de pacientes com leucemia e uma varivel concomitante WBC, representando a contagem de
glbulos brancos por 10.000 unidades na clula dos pacientes. Baseado no exame das clulas
com leucemia, os pacientes foram classicados como AG positivo e AG negativo. Na Tabela
5, temos os dados de 17 pacientes com AG positivo.
Tabela 5: Dados de pacientes com leucemia (AG positivo).
WBC/10.000
tempo
WBC/10.000
tempo
0,230
65
0,700
143
0,075
156
0,940
56
0,430
100
3,200
26
0,260
134
3,500
22
0,600
16
10,000
1,050
108
10,000
1,000
121
5,200
1,700
10,000
65
0,540
39
A partir do modelo (3) e sendo x o logaritmo da contagem de glbulos brancos medidos

em unidades de 10.000, 1 representa o tempo mdio de sobrevivncia de um paciente com a
11
contagem de glbulos brancos com 10.000 unidades e 2 representa o ganho no tempo mdio
de sobrevivncia correspondente a um acrscimo no percentual da contagem de glbulos
brancos.
Analogamente ao estudo de simulao, construmos as cadeias a partir da distribuio a
posteriori. Considerando um tempo de aproximadamente dois anos (t0 = 96), a funo de
sobrevivncia em pacientes com a contagem de glbulos brancos igual a 50.000 unidades
).
dada por S = exp ( 196
52
As medidas resumo para os parmetros 1 e 2 e para S e so apresentadas, respectivamente, nas Tabelas 6 e 7.
Tabela 6: Resumos a posteriori para 1 e 2 .
Mdia
DP
IC-95%
Geweke
86,3200
16,9887
[ 56,9355 ; 123,4608 ]
-0,0875
-0,1537
0,0418
[-0,2318 ; -0,0683]
0,5172
Tabela 7: Resumos a posteriori para S e .

Mdia
DP
IC-95%
Geweke
0,0858
0,0389
[ 0,0228 ; 0,1707]
-1,5860
-0,1572
0,0430
[-0,2414 ; -0,0739]
-1,3310
Os resumos a posteriori para os parmetros encontramos nas Tabelas 6 e 7 mostra que

os resultados obtidos para 2 e so muito prximos, o que j era esperado, visto a reparametrizao adotada em (14). Alm disso, observamos que a probabilidade de um indivduo
sobreviver alm do tempo t0 = 96 sabendo que a quantidade de glbulos brancos igual a
50.000 unidades de 0, 0858.
Concluso
Neste trabalho consideramos o modelo de Regresso de Feigl e Zelen (1965), onde con-
seguimos obter inferncias para os parmetros de interesse e para a funo de sobrevivncia

no tempo t0 . Utilizamos a abordagem de anlise de referncia, pois essa teoria fornece um
12
mtodo para obteno de uma distribuio a priori no informativa e produz inferncia bayesiana propria para o problema de regresso exponencial. O mtodo MCMC foi utilizado para
obteno das posteriori marginais.
Com os dados simulados, vericamos a adequabilidade do modelo, sendo que os resultados
encontrados foram satisfatrios. Tambm consideramos um conjunto de dados reais proposto
por Feigl e Zelen (1965) para ilustrar a metodologia proposta.
Finalmente importante enfatizar que sumarizamos a derivao da distribuio a posteriori de referncia para o caso de dois parmetros, o qual fornece solues bayesiana para
problemas que no tem uma priori subjetiva. Isto tem sido um assunto polmico entre muitos estatsticos, a escolha responsvel e cuidadosa de uma priori no subjetiva pode ser uma
melhor alternativa. Alm disso, esta metodologia generaliza algumas alternativas propostas
anteriormente, como por exemplo a distribuio a priori de Jereys
Referncias Bibliogrficas
1. Berger, J. O. and Bernardo, J. M. (1989). Estimating a product of means: Bayesian
analysis with reference priors. J. Amer. Statist. Assoc. 84, 200207.
2. Berger, J. O. and Bernardo, J. M. (1992a). Ordered group reference priors with applications to a multinomial problem. Biometrika 79, 2537.
3. Berger, J. O. and Bernardo, J. M. (1992b). Reference priors in a variance components
problem. Bayesian Analysis in Statistics and Econometrics (P. K. Goel and N. S.
Iyengar, eds.) Berlin: Springer, 323340.
4. Berger, J. O. and Bernardo, J. M. (1992c). On the development of reference priors.
Bayesian Statistics 4 (J. M. Bernardo, J. O. Berger, A. P. Dawid and A. F. M. Smith,
eds.) Oxford: University Press, 3560 (with discussion).
5. Berger J. O., Bernardo J. M. Sun D. (2008). The formal denition of reference priors.
Submitted of Annals of Statistics 36.
6. Berger, J. O., Bernardo, J. M. and Sun, D. (2005). Reference priors from rst principles:
A general denition. Tech. Rep., SAMSI, NC, USA.
13
7. Bernardo, J. M. (1979). Reference posterior distributions for Bayesian inference. J.

Roy. Statist. Soc. B 41, 113147 (with discussion). Reprinted in Bayesian Inference
(N. G. Polson and G. C. Tiao, eds.) Brookeld, VT: Edward Elgar, 1995, 229263.
8. Berger J. O., Bernardo J. M. Sun D.; The Formal Denition of Reference Priors. The
Annals of Statistics, Vol. 37, No. 2, pp.905-938, 2009.
9. Berger, J. O., Bernardo, J. M.; Sun, D., Reference priors from rst principles: A general
denition. Tech. Rep., SAMSI, NC, USA, 2005.
10. Berger J., The Case for Objective Bayesian Analysis. Bayesian Analysis, 2006.
11. Bernardo, J. M., Reference Analysis, Handbook of Statistics 25 (D. K. Dey and C. R.
Rao, eds), pp. 17-90. Elsevier,2005.
12. Bernardo, J. M.; Smith, A. F. M., Bayesian Theory, Chichester: Wiley, 1994.
13. Buckley, J.; James, I., Linear regression with censored data, Biometrika 66, 429-436,
1979.
14. Collet, D. , Modelling Survival Data in Medical Research, Chapman & Hall, 1994.
15. Feigl, P.; Zelen, M., Estimation of exponencial survival probabilities with concomitant
information, Biometrics, Vol. 21, pp.826-838, 1965.
16. Gamerman, D.; Lopes, H.; Markov Chain Monte Carlo, Stochastic Simulation for Bayesian Inference, 2002.
17. Gelman, A.; Rubin, D. R., A single series from the Gibbs sampler provides a false sense
of security. Bayesian Statistics 4, pp. 625-631. Oxford: university Press, 1992.
18. Geweke, J., Evaluating the accuracy of sampling-based approaches to the calculation
of posterior moments. In Bayesian Statistics 4, pp. 169-193, 1992.
19. Hastings, W. K., Monte Carlo sampling methods using Markov chains and their applications, Biometrika, Vo. 57, No. 1, pp. 97-109, 1970.
20. Jereys, H., Theory of Probability, 3rd edition, Oxford: Claredon Press, 1961.
21. Lawless, J. F., Statistical Models and Methods for Lifetime Data, New York: John
Wiley & Sons., 580 p., 1982.
14
22. Miller, R. G., Least squares regression with censored data. Biometrika 63 pp. 449-464,
1976.
23. R Development Core Team, R: A Language and Environment for Statistical Computing, R Foundation for Statistical Computing, Vienna, Austria, URL: http://www.Rproject.org/ 2010.
24. Tibshirani, R., Noninformative priors for one patameter of many, Biometrika 76, pp.
604-608, 1989.
25. Zippin, C.; Armitage, P. Use of concomitant variables and incomplete survival information in the estimation of an exponential survival parameter, Biometrics, pp. 665-672,
1966.
26. Weibull, W., A statistical distribution of wide applicability, Journal of Applied Mechanics, Vol. 18, pp. 293-297, , 1951.
15

Inferencia Bayesiana

Uploaded by

Document Information

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Inferencia Bayesiana

Uploaded by

Copyright:

Available Formats

Estimao Bayesiana Objetiva do Modelo de

Regresso de Feigl e Zelen

Teresa Cristina Martins Dias

de estudar a funo de risco/sobrevivncia de um paciente ou sistema e aplicaes podem

Para dados no censurados, os autores introduziram o modelo log-linear no qual

Neste trabalho, o interesse est em estimar a funo de sobrevivncia, assumindo que

Modelo de Regresso de Feigl e Zelen

distribuio exponencial cuja funo de densidade de probabilidade dada por:

sendo t 0 e > 0 o parmetro desconhecido representando a taxa de falha constante. A

partir de (2), o tempo mdio de sobrevivncia dado por E(T ) = .

A funo de verossimilhana para os parmetros do modelo (3) dada por,

e, denotando l(1 , 2 ) = log(L(1 , 2 )) encontramos,

As primeiras e segundas derivadas para os parmetros 1 e 2 , obtidas de (6) so,

Os parmetros do modelo de Feigl e Zelen (1965), assim como a funo de sobrevivncia,

Chamando S(t0 ) = S e considerando a reparametrizao,

Para o modelo (3) e a reparametrizao dada em (14), a funo de verossimilhana para

A matriz de informao de Fisher em termos dos parmetros S e pode ser obtida da

o jacobiano da transformao inversa. Assim, possvel escrever a matriz

de informao de Fisher e sua inversa, dadas respectivamente por,

S 2 (log(S))2 (nx0 (x0 2

2. se (|) no prpria, uma aproximao compacta {i (), i = 1, 2, } para ()

3. dentro de cada i (), a funo a priori de referncia marginal de obtida por,

sendo s11 (, ) = h (, ) = h11 h12 h1

4. a distribuio a posteriori de referncia de dado os dados {x1 , , xn }

A justicativa eurstica desta proposio pode ser vista em Bernardo (2005).

funes s11 (, ) e h22 (, ) fatoriza na forma

{s11 (, )}1/2 = f1 ()g1 () e {h22 (, )}1/2 = f2 ()g2 (),

Inferncia para os parmetros do modelo

Assim a distribuio a priori de referncia conjunta para 1 e 2

Inferncia para a funo de sobrevivncia do modelo

Considerando a reparametrizao dado em 14, onde S e so os parmetros de interesse

g2 () 1. Portanto, a distribuio a priori conjunta para S e

A Figura 1 mostra o comportamento da funo a priori de referncia para o parmetro

Figura 1: Funo a priori de referncia para S.

As distribuies a posteriori condicionais para S e so dadas respectivamente por,

A distribuio a posteriori marginal, encontrada integrando a densidade a posteriori

[67, 27 ; 117, 78]

[0, 699 ; 0, 142]

[70, 52 ; 109, 57]

[0, 717 ; 0, 275]

[63, 42 ; 94, 28]

[0, 674 ; 0, 289]

[71, 08 ; 93, 96]

[0, 636 ; 0, 376]

Considerando que o interesse est na funo de sobrevivncia, para os mesmos conjuntos

= 0.5. As estimativas para os parmetros S e so mostradas na Tabela 2.

[0, 148 ; 0, 370]

[0, 697 ; 0, 149]

[0, 153 ; 0, 320]

[0, 710 ; 0, 288]

[0, 127 ; 0, 268]

[0, 671 ; 0, 296]

[0, 159 ; 0, 259]

[0, 635 ; 0, 374]

Observamos pelas Tabelas 1 e 2 que para tamanho de amostra pequeno ou moderado as

Prob. de Cobertura Amplitude

Tabela 4: Probabilidade de cobertura e Amplitude do IC para S e .

Prob. de Cobertura Amplitude

Aplicao com os Dados de Feigl e Zelen

Os dados de Feigl e Zelen (1965) consistem de tempos de sobrevivncia (em semanas)

A partir do modelo (3) e sendo x o logaritmo da contagem de glbulos brancos medidos

Tabela 7: Resumos a posteriori para S e .

Os resumos a posteriori para os parmetros encontramos nas Tabelas 6 e 7 mostra que

seguimos obter inferncias para os parmetros de interesse e para a funo de sobrevivncia