You are on page 1of 14

ESTUDO DA DISTRIBUIO ASSINTTICA DOS ESTIMADORES DOS

PARMETROS DA DISTRIBUIO WEIBULL NA PRESENA DE


DADOS SUJEITOS A CENSURA ALEATRIA

Almir MANTOVANI
2
Maria Aparecida de Paiva FRANCO
RESUMO: O objetivo deste trabalho foi realizar um estudo sobre a distribuio dos estimadores
de mxima verossimilhana dos parmetros da Weibull na presena de dados censurados
utilizando simulao. Especificamente considerou-se o caso em que a inferncia sobre os
parmetros feita a partir da observao de uma amostra de tamanho n de (X,) onde X=
mnimo(T,C), sendo que T tem distribuio de Weibull com parmetros p e , C uma varivel
aleatria independente de T com distribuio Uniforme em (0,c), e uma indicadora do evento
(X=T). Foram simuladas 1.000 amostras de (X,) para cada um dos seguintes tamanhos de
amostra: 10, 20 e 50, para diversos valores de c e diferentes porcentagens esperadas de censura.
Os resultados apontam para a validade da aproximao assinttica normal para as distribuies
marginais dos estimadores de mxima verossimilhana dos parmetros da Weibull na presena de
censura.
PALAVRAS-CHAVE: Anlise de sobrevivncia; censuras; distribuio assinttica; mxima
verossimilhana; simulao; Weibull.

1 Introduo
Na ausncia de censura e sob condies de regularidade sobre a funo densidade de
probabilidade f(t,) de uma varivel aleatria T, os estimadores de mxima
verossimilhana do vetor de parmetros a partir de uma amostra aleatria de tamanho n
de T, tm uma distribuio assinttica conjunta normal multivariada com vetor de mdias
igual ao vetor de parmetros e com matriz de covarincia igual inversa da matriz de
Informao de Fisher (Cordeiro, 1992, Leite e Singer, 1990). Quando T tem distribuio
de Weibull com dois parmetros estas condies so satisfeitas (Kotz e Johnson, 1988,
p.551). No entanto, o mesmo no ocorre com a distribuio de Weibull com trs
parmetros (Johnson e Kotz, 1970, p.256).
prtica usual na literatura de Anlise de Sobrevivncia (Kalbfleisch e Prentice,
1980, Lawless, 1982) usar o Teorema sobre a distribuio assinttica dos estimadores de
1
Departamento de Educao, Cincias Sociais e Poltica Internacional; Faculdade de Histria, Direito e
Servio Social; Universidade Estadual Paulista - UNESP, CEP14400-690, Franca, SP, Brasil. E-mail:
almir@franca.unesp.br
2
Departamento de Estatstica, Universidade Federal de So Carlos - UFSCar, CEP 13565-905, So Carlos,
SP, Brasil.

Rev. Mat. Estat., So Paulo, v. 22, n.3, p.7-20, 2004

mxima verossimilhana deduzido sob condies de regularidade da distribuio de T,


mesmo no caso em que os estimadores so obtidos a partir de observaes possivelmente
censuradas de T. O objetivo deste trabalho fazer um estudo por simulao da validade de
tal procedimento no caso em que T tem distribuio de Weibull com dois parmetros, e as
observaes so sujeitas censura tipo I por uma varivel C com distribuio Uniforme.
Foram escolhidos diversos tamanhos de amostras e diversos valores para os
parmetros da Weibull. Para avaliar o efeito da porcentagem de observaes censuradas
na amostra sobre propriedades destes estimadores, foram calculados os valores do
parmetro c da distribuio Uniforme em (0,c) que propiciam determinadas porcentagens
esperadas de valores censurados.
Na seo 2 deste trabalho, apresentada a parametrizao usada para representar a
distribuio de Weibull e a expresso da funo de verossimilhana para os parmetros da
Weibull, a partir de amostras de tamanho n, sujeitas censura por uma varivel aleatria
independente C. Ainda nesta seo, apresentado o desenvolvimento feito aqui para
calcular P(T>C), isto , a probabilidade de se obter um valor censurado, como funo dos
parmetros da Weibull e da Uniforme, quando T e C so independentes. Os valores
escolhidos dos parmetros das distribuies de Weibull e Uniforme para o estudo por
simulao esto na Tabela 1.
Na seo 3, esto descritos os procedimentos realizados para o estudo por simulao
da estimao dos parmetros por mxima verossimilhana, no caso de distribuies de
Weibull com dados censurados. Na seo 4, so apresentados os resultados relativos ao
estudo emprico das propriedades dos estimadores de Mxima Verossimilhana. Na seo
5 encontra-se a Concluso seguida do Abstract e das Referncias.

2 Estimao dos parmetros da distribuio de Weibull por mxima


verossimilhana
Se a distribuio do tempo de vida T pertence famlia Weibull com parmetro de
forma p e de escala , as funes densidade de probabilidade, de sobrevivncia e de risco
so dadas respectivamente por (2.1), (2.2) e (2.3), (Lee, 1992, Miller, 1981).

fT (t) = p

t p 1 exp

ST (t) = exp

h(t) =

t 0, , p > 0

(2.1)

(2.2)

p 1

, para t 0, p, > 0

(2.3)

Quando algumas das n observaes so censuradas em uma amostra de n indivduos


observados sob um esquema de censura aleatria tipo I, e os tempos de vida seguem a

Rev. Mat. Estat., So Paulo, v. 22, n.3, p.7-20, 2004

distribuio Weibull com funo densidade dada por (2.1), a funo de verossimilhana
dos parmetros e p dada por (2.4).
L(,p) =

( f T (t i ; , p ))

1 i

( ST (t i ; , p))

i =1

i =1

(2.4)

Com relao funo de risco e funo de Sobrevivncia, a funo de


verossimilhana pode, ainda, ser escrita como:
n

L(,p) = ( hT (t i ; , p )) i
i =1

( ST (ti ; , p)) ,

(2.5)

i =1

Portanto,
n

L(,p) =

i=1

ti

p1

exp

i=1

ti

(2.6)

O logaritmo da funo de verossimilhana


log[L(,p)] = r log(p) rp log() + (p-1)
n

onde r =

n
1

i log( ti )

ti

(2.7)

i o nmero de observaes no censuradas.

i =1

A expresso (2.7) foi utilizada, neste trabalho, no programa computacional escrito


para o clculo das estimativas dos parmetros de uma distribuio de Weibull. De (2.7),
obtm-se

log L ( , p )
rp p
=
+

ti

e
n
n t
log L( , p) r
i
= - r log()+ i log( t i )
p

p
i =1
1

log

ti

(2.8)

As expresses (2.8), para as derivadas parciais da funo de log verossimilhana,


podem ser utilizadas para o clculo das estimativas de mxima verossimilhana dos
parmetros atravs do mtodo de Newton Raphson. Resultados da literatura afirmam que
as condies de regularidade exigidas para os resultados assintticos a respeito da

Rev. Mat. Estat., So Paulo, v. 22, n.3, p.7-20, 2004

distribuio de mxima verossimilhana dos parmetros so sempre satisfeitas quando as


observaes so completas (Kotz e Johnson, 1988, p.551).

2.1 Porcentagem esperada de valores censurados em amostras da


distribuio de Weibull, com observaes sujeitas a censura aleatria do
Tipo I
A probabilidade de obter um valor censurado em uma observao de T e C dada
por P[T>C], que pode ser calculada, conforme exposto abaixo, no caso de censura
aleatria tipo I, quando T e C so variveis no negativas e independentes:
t

P[T>C] =
0 0

f T (t ) f C ( c ) dcdt =

f T (t ) dt

f T (t ) S C (t )dt ,

(2.9)

Para o desenvolvimento do presente trabalho, foi necessrio calcular a probabilidade


(2.9), quando T tem distribuio Weibull (p,), e C tem distribuio Uniforme em [0,c].
Assim, a porcentagem esperada de censuras, que s depende de p e da razo

, dada por:

P[T>C] = exp

1+

1
p

1+ 1 ;
p

(c )p

(2.10)

onde

( x ) = t x 1e t dt a Funo Gama
0

( x , z ) = t x 1e t dt a Funo Gama incompleta.


z

Na Figura 1, ilustra-se a porcentagem esperada de censuras, atravs da funo


g(p)=P[T>C], quando T tem distribuio de Weibull de parmetros de forma p e de escala
=3,15 com censura Uniforme em (0,5).
Usando a expresso (2.10) e fixando-se o valor de um dos parmetros, por exemplo,
o parmetro de escala , e o valor de C da distribuio Uniforme, obtm-se o valor do
parmetro de forma p, de modo que P[T>C] seja igual a um valor P desejado, por

10

Rev. Mat. Estat., So Paulo, v. 22, n.3, p.7-20, 2004

g(p)

exemplo P=0,50. No caso da Figura 1, onde igual a 3,15, para obter 50% de censuras
preciso que p seja igual a 1.

p
FIGURA 1 - Funo g(p)=P[T>C] para T com distribuio Weibull (p; =3,15) e C com
distribuio U (0,5), independente de T.

2.2 Escolha dos parmetros das distribuies Weibull e Uniforme de modo


a obter uma determinada porcentagem esperada de observaes
censuradas
Em amostras casuais de tamanho n de (T,C), a porcentagem esperada de censuras
entre as n observaes dada por P[T>C]. Em uma simulao de uma amostra de n pares
(T,C), a freqncia relativa de observaes censuradas na amostra uma varivel aleatria
com Esperana igual a P[T>C]. Pela lei forte dos grandes nmeros, a freqncia relativa
de observaes censuradas na amostra prxima de sua Esperana, de modo que, cerca de
P[T>C]100% das observaes na amostra sero censuradas.
Neste estudo de simulao, 42 diferentes casos para os parmetros das distribuies
de T e de C foram analisados. Os parmetros para a distribuio dos tempos de vida foram
escolhidos de modo que o coeficiente de variao assumisse os valores 0,25, 0,33, 0,4,
0,5, 1 e 2. O limite superior c da distribuio de censura U(0,c) foi escolhido de modo a
produzir as propores esperadas de observaes censuradas em amostras de tamanho n
de (X,) iguais a 0,25, 0,50 ou 0,75.
A Tabela 1 apresenta as informaes referentes ao caso 2 e ao caso 25, cujos
resultados grficos (quantis e funes densidades) so apresentados na seo 4.

Rev. Mat. Estat., So Paulo, v. 22, n.3, p.7-20, 2004

11

Tabela 1 - Parmetros da distribuio de T (Weibull) com coeficientes de variao

especificados, da distribuio de C (Uniforme) e porcentagens esperadas de


observaes censuradas

Caso
2
25

Coeficiente
de variao
de T
1
0,4

Parmetros da
distribuio de T
P

1
2,5

1,28
4,22

Parmetros da
distribuio de C
1
2
amostra amostra
5
15

5
7,45

% esperada de
censuras
1
2
amostra amostra
25%
25%

25%
50%

3 Estudo por simulao da estimao dos parmetros por mxima


verossimilhana, no caso de distribuies de Weibull com dados
censurados
Em cada um dos 42 casos estudados, incluindo os casos apresentados na Tabela 1,
foram geradas 1.000 amostras independentes de mesmo tamanho n de pares (T,C), onde T
tem distribuio de Weibull e independente de C que tem distribuio Uniforme. Cada
par (T,C) foi transformado no par (X,) onde X=mnimo(T,C) e a varivel indicadora
de censura. Para cada caso, foi feito o estudo com amostras de tamanho 10, 20 e 50.
Em cada uma das 1.000 amostras aleatrias independentes de pares de (Xj;) de um
determinado tamanho n, foram calculadas as estimativas de mxima verossimilhana dos
parmetros da distribuio de T, utilizando um programa escrito em S-Plus, que faz uso
do procedimento NLMIN.
Para verificar a validade da aproximao assinttica pela distribuio normal da
distribuio dos estimadores dos parmetros da distribuio Weibull, com dados
censurados, foi feita a comparao das distribuies empricas dos estimadores de
mxima verossimilhana dos parmetros com a distribuio Normal, por meio do grfico
de densidades e de grficos de quantis dessas distribuies empricas versus quantis da
distribuio Normal.

4 Resultados
As Figuras 2, 3, 4, 5, 6 e 7 ilustram um dos casos estudados (caso 2), quando T tem
distribuio de Weibull de parmetros de forma p=1 e de escala =1,28, com censura
Uniforme em (0,5) e visam a comparao dos resultados obtidos por simulao, relativos
estimao dos parmetros da distribuio Weibull por Mxima Verossimilhana com os
resultados assintticos, vlidos sob condies de regularidade.
Nas Figuras 2, 3 e 4, comparam-se os quantis da distribuio emprica das
estimativas dos parmetros p ( esquerda) e ( direita) com os quantis da distribuio
normal padro, a partir de 1.000 amostras de (X,) (grficos superiores) e mais 1.000
amostras independentes de (X,) (grficos inferiores), para amostras de tamanho 10, 20 e
50 respectivamente.

12

Rev. Mat. Estat., So Paulo, v. 22, n.3, p.7-20, 2004

FIGURA 2 - Quantis das estimativas por Mxima Verossimilhana dos parmetros p ( esquerda) e
( direita), a partir de dois conjuntos de 1.000 amostras de (X, ), para T~Weibull (1;
1,28) e C~Uniforme (0, 5) versus quantis da normal padro, para n=10.

FIGURA 3 - Quantis das estimativas por Mxima Verossimilhana dos parmetros p ( esquerda) e
( direita), a partir de dois conjuntos de 1.000 amostras de (X, ), para T~Weibull (1;
1,28) e C~Uniforme (0, 5) versus quantis da normal padro, para n=20.

Rev. Mat. Estat., So Paulo, v. 22, n.3, p.7-20, 2004

13

FIGURA 4 - Quantis das estimativas por Mxima Verossimilhana dos parmetros p ( esquerda)
e ( direita), a partir de dois conjuntos de 1.000 amostras de (X, ), para T~Weibull
(1; 1,28) e C~Uniforme (0, 5) versus quantis da normal padro, para n=50.

As Figuras 2, 3 e 4 sugerem que a distribuio dos estimadores de Mxima


Verossimilhana dos parmetros se afasta da distribuio normal nas caudas das curvas,
com afastamento mais acentuado direita. Para amostras de tamanho 50, esse afastamento
ocorre de maneira menos acentuada que nos casos onde n=10 ou 20.
Nas Figuras 5, 6 e 7 esto as estimativas de funes densidades dos estimadores de
Mxima Verossimilhana dos parmetros p ( esquerda) e ( direita), a partir de 1.000
amostras de (X,) (grficos superiores) e mais 1.000 amostras independentes de (X,)
(grficos inferiores), quando T tem distribuio de Weibull de parmetros de forma p=1 e
de escala =1,28, com censura Uniforme em (0,5) para amostras de tamanho 10, 20 e 50
respectivamente.

FIGURA 5 - Estimativas das funes densidade dos estimadores de Mxima Verossimilhana dos
parmetros p ( esquerda) e ( direita), a partir de dois conjuntos de 1.000 amostras
de (X, ), para T~Weibull (1; 1,28) e C~Uniforme (0, 5) para n=10.
14

Rev. Mat. Estat., So Paulo, v. 22, n.3, p.7-20, 2004

FIGURA 6 - Estimativas das funes densidade dos estimadores de Mxima Verossimilhana dos
parmetros p ( esquerda) e ( direita), a partir de dois conjuntos de 1.000 amostras
de (X, ), para T~Weibull (1; 1,28) e C~Uniforme (0, 5) para n=20.

FIGURA 7 - Estimativas das funes densidade dos estimadores de Mxima Verossimilhana dos
parmetros p ( esquerda) e ( direita), a partir de dois conjuntos de 1.000 amostras
de (X, ), para T~Weibull (1; 1,28) e C~Uniforme (0, 5) para n=50.

As Figuras 5 e 6 confirmam que a distribuio dos estimadores de Mxima


Verossimilhana dos parmetros se afasta da distribuio normal nas caudas das curvas
para amostras de tamanho 10 ou 20. Para amostras de tamanho 50 esse afastamento
ocorre, porm, de maneira menos acentuada como pode ser observado na Figura 7.

Rev. Mat. Estat., So Paulo, v. 22, n.3, p.7-20, 2004

15

A seguir, ilustra-se o estudo realizado para o caso 25, onde T tem distribuio de
Weibull de parmetros de forma p=2,5 e de escala =4,22 e C tem distribuio Uniforme
em (0,c). O valor do parmetro da distribuio de C para uma porcentagem esperada de
censura da ordem de 25% para a primeira amostra c=15, e c=7,45 para a segunda
amostra para uma porcentagem esperada de censura da ordem de 50%.
Nas Figuras 8, 9 e 10, comparam-se os quantis da distribuio emprica das
estimativas dos parmetros com os quantis da distribuio normal padro.

FIGURA 8 - Quantis das estimativas por Mxima Verossimilhana dos parmetros p ( esquerda) e
( direita), a partir de dois conjuntos de 1.000 amostras de (X, ), para T~Weibull
(2,5; 4,22) e C~Uniforme (0, c) versus quantis da normal padro, para n=10.

FIGURA 9 - Quantis das estimativas por Mxima Verossimilhana dos parmetros p ( esquerda) e
( direita), a partir de dois conjuntos de 1.000 amostras de (X, ), para T~Weibull
(2,5; 4,22) e C~Uniforme (0, c) versus quantis da normal padro, para n=20.
16

Rev. Mat. Estat., So Paulo, v. 22, n.3, p.7-20, 2004

FIGURA 10 - Quantis das estimativas por Mxima Verossimilhana dos parmetros p ( esquerda)
e ( direita), a partir de dois conjuntos de 1.000 amostras de (X, ), para T~Weibull
(2,5; 4,22) e C~Uniforme (0, c) versus quantis da normal padro, para n=50.

Nota-se, nas Figuras 8, 9 e 10, que a distribuio dos estimadores de Mxima


Verossimilhana do parmetro de forma se afasta da distribuio normal nas caudas das
curvas e que o afastamento menos acentuado para o parmetro de escala.
As Figuras 11, 12 e 13 ilustram, para amostras de tamanho 10, 20 e 50,
respectivamente, as estimativas de funes densidades dos estimadores de Mxima
Verossimilhana, quando T tem distribuio de Weibull de parmetros de forma p=2,5 e
de escala =4,22 e C tem distribuio U(0; 15) para a primeira amostra, e U(0; 7,45) para
a segunda amostra.

FIGURA 11 - Estimativas das funes densidade dos estimadores de Mxima Verossimilhana dos
parmetros p ( esquerda) e ( direita), a partir de dois conjuntos de 1.000 amostras
de (X, ), para T~Weibull (2,5; 4,22) e C~Uniforme (0, c) para n=10.

Rev. Mat. Estat., So Paulo, v. 22, n.3, p.7-20, 2004

17

FIGURA 12 - Estimativas das funes densidade dos estimadores de Mxima Verossimilhana dos
parmetros p ( esquerda) e ( direita), a partir de dois conjuntos de 1.000 amostras
de (X, ), para T~Weibull (2,5; 4,22) e C~Uniforme (0, c) para n=20.

FIGURA 13 - Estimativas das funes densidade dos estimadores de Mxima Verossimilhana dos
parmetros p ( esquerda) e ( direita), a partir de dois conjuntos de 1.000 amostras
de (X, ), para T~Weibull (2,5; 4,22) e C~Uniforme (0, c) para n=50.

As Figuras 11 e 12 sugerem que a distribuio dos estimadores de Mxima


Verossimilhana dos parmetros se afasta de uma distribuio normal, principalmente nas
caudas das curvas e para amostras de tamanho 10 e 20. Como observado nas Figuras 8 e
9, esse afastamento menos acentuado no caso dos parmetros de escala. Para amostras
de tamanho 50, no entanto, as Figuras 10 e 13 sugerem que a distribuio assinttica dos
estimadores se aproxima de uma distribuio normal.
18

Rev. Mat. Estat., So Paulo, v. 22, n.3, p.7-20, 2004

Para a maioria dos 42 casos estudados, observou-se que os resultados obtidos para as
estimativas dos parmetros da distribuio de Weibull por Mxima Verossimilhana,
eram semelhantes aos dois casos aqui descritos.

Concluso
Os resultados obtidos no estudo da distribuio assinttica dos estimadores de
mxima verossimilhana dos parmetros da distribuio Weibull, sujeito a censura
aleatria direita pela distribuio Uniforme, sugerem que a aproximao normal ainda
no adequada, principalmente no que se refere ao parmetro de forma para amostras de
tamanho 10 e 20. Para amostras de tamanho 50 h uma indicao de que a aproximao
normal satisfatria para as distribuies marginais dos estimadores de cada um dos
parmetros (de forma e de escala). Este estudo deve ser confirmado usando outras
distribuies para a varivel de censura C.
MANTOVANI, A.; FRANCO, M. A. de P. A study on the asymptotic distribution of
maximum likelihood estimators for a two-parameter Weibul distribution in censored
samples. Rev. Mat. Estat., So Paulo, v.22, n.3, p.7-20, 2004.
ABSTRACT: The objective of this work is to study by simulation the asymptotic distribution of
maximum likelihood estimators of the parameters of a Weibull distribution, when observations
are subject to random censorship. The study was made by supposing that C has a Uniform
distribution in [0,c] and is independent of T. The inference is made from samples of (X,), where
X= min(T,C) and is the indicator variable of the event (X=T). The study comprises the
simulation of 1,000 samples of each one of the following sizes 10, 20 and 50. Several values of c
giving different expected percentages of censored values in the sample were considered. The
conclusion is that there is empirical evidence of an asymptotic normal distribution for each
marginal distribution of the maximum likelihood estimators of parameters of Weibull
distribution.
KEYWORDS: Survival analysis; censorship; maximum likelihood; simulation; Weibull.

Referncias
CORDEIRO, G. M. Introduo teoria de verossimilhana.: livro-texto do 10 Simpsio
Nacional de Probabilidade e Estatstica. Rio de Janeiro, 1992.174p.
JOHNSON, N. L.; KOTZ, S. Continuous univariate distributions. Boston: Houghton
Mifflin, 1970.,v.1, 756p.
KALBFLEISCH, J. D.; PRENTICE, R. L. The statistical analysis of failure time data.
New York: John Wiley, 1980. 321p.
KOTZ, S.; JOHNSON, N. L. Encyclopedia of statistical sciences. New York: John Wiley,
1988., v.9, 762p.
LAWLESS, J. F. Statistical models and methods for lifetime data. New York: John Wiley,
1982. 580p.

Rev. Mat. Estat., So Paulo, v. 22, n.3, p.7-20, 2004

19

LEE, E. T. Statistical methods for survival data analysis. 2nd ed. New York: John Wiley,
1992. 482p.
LEITE, J. G.; SINGER, J. M. Mtodos assintticos em estatstica: fundamentos e
aplicaes. So Paulo: IME-USP, 1990. 130p.
MILLER, R. G. Survival analysis. New York: John Wiley, 1981. 238p.
Recebido em 23.09.2003.
Aprovado aps reviso em 02.12.2004.

20

Rev. Mat. Estat., So Paulo, v. 22, n.3, p.7-20, 2004

You might also like