Professional Documents
Culture Documents
Modelos de Regresso:
uma aplicao em Medicina Dentria
Orientadora:
Lisboa 2013
Ao meu marido
ii
minha Me
iii
AGRADECIMENTOS
Ao meu querido marido, pelo apoio incondicional, pela sua compreenso e contnua
motivao, mesmo nos momentos mais difceis, o meu muito obrigada.
O meu agradecimento a todos os meus amigos que tornaram possvel a realizao deste
trabalho, sempre demonstrando o seu apoio, mesmo quando tudo parecia impossvel.
iv
RESUMO
Ao proceder deste modo penso poder dar algum contributo para a aplicao correta da
estatstica em trabalhos biolgicos, alertando para que a anlise tem que ser adequada e os
resultados devem ser devidamente interpretados.
v
SUMMARY
The biological phenomena are usually highly complex due to the multifactorial aetiology. Thus
the statistical analysis is an indispensable tool find associations and complex interactions
between different potential causal factors and the dependent variable under study. In this
context the statistical analysis is a major importance tool to access the associations and
interactions between dependent and independent variables. The choice of analysis type must
be grounded on solide theoretical bases and take in account the experimental design and the
nature of the phenomena of interest, in order give the researcher a correct perception of the
phenomenon under study.
This work is an effort to highlight the importance of a correct application and interpretation of
the statistics in biological work.
vi
SIMBOLOGIA E NOTAES
IP ndice de placa
LDL Lipoprotenas de baixa densidade
NA Nvel de aderncia clnica
PS Profundidade de sondagem
RG Retrao gengival
RCA Relao permetro da cinta/permetro da anca
vii
T Triglicerdeos
H0 Hiptese Nula
H1 Hiptese Alternativa
VD Varivel dependente
VI Varivel independente
Mdia da observao i
Varincia amostral de
Erro aleatrio
Efeito do tratamento i
Coeficiente de determinao
Coeficiente de Correlao
Coeficiente de varincia
viii
NDICE
Agradecimentos .................................................................................................................... iv
Resumo .................................................................................................................................. v
Summary ............................................................................................................................... vi
Simbologia e Notaes .......................................................................................................... vii
ndice de Tabelas .................................................................................................................. xi
ndice Figuras ....................................................................................................................... xiii
ndice de Anexos .................................................................................................................. xv
Introduo .................................................................................................................... 1
PARTE I
1. Anlise de Varincia (ANOVA) aplicada Regresso .................................................. 5
2. Tcnicas de Inferncia Estatstica No Paramtrica .................................................... 7
2.1. Teste do Qui-quadrado para a independncia ................................................... 10
2.2. Testes para duas ou mais amostras independentes .......................................... 12
2.3. Testes de Correlao ......................................................................................... 21
3. Anlise de regresso ................................................................................................. 24
3.1. Regresso e Correlao Linear .......................................................................... 25
3.2. Modelo de Regresso Linear Simples ................................................................ 27
3.2.1. Reta de Regresso .................................................................................... 27
3.2.2. Mtodo dos Mnimos Quadrados .............................................................. 28
3.2.3. Qualidade do ajustamento da reta ............................................................ 30
3.2.4. Pressupostos da Anlise de Regresso Linear Simples ........................... 31
3.2.5. ANOVA aplicada RLS ............................................................................ 32
3.2.6. Teste de Hipteses e Intervalos de Confiana
para os Coeficientes do MRLS ................................................................. 33
3.3. Modelo de Regresso Linear Mltipla ................................................................ 35
3.3.1. Anlise de Varincia (ANOVA) Aplicada Regresso Linear Mltipla ...... 36
3.3.2. Teste de significncia da equao de Regresso Linear Mltipla ............. 37
3.3.3. Teste de Partes de um Modelo de Regresso Linear Mltipla .................. 37
3.3.4. Coeficiente de determinao parcial ......................................................... 38
3.3.5. Inferncia sobre os coeficientes de determinao parcial ......................... 38
3.3.6. Intervalos de Confiana da Regresso Linear Mltipla ............................. 39
3.3.7. Avaliao da Regresso Linear Mltipla ................................................... 39
ix
3.4 Modelo de Regresso Logstica ............................................................................... 39
3.4.1. Estimao de parmetros em regresso logstica.. 42
3.4.2. Mtodo de seleo baseado no critrio de informao..................................... 46
4. Tcnicas de visualizao de informao .................................................................... 48
4.1. Fundamentos da visualizao grfica ................................................................ 48
4.2. Tipos de grficos aplicados neste estudo ........................................................... 50
5. Diabetes Mellitus e Periodontite ................................................................................. 60
PARTE II
1. Introduo ................................................................................................................. 65
2. Visualizao grfica e anlise exploratria dos dados ............................................... 72
3. Testes no paramtricos ........................................................................................... 76
3.1. Teste de Mann-Whitney .................................................................................... 76
3.2. Interpretao grfica .......................................................................................... 78
3.3. Teste de t de Student ......................................................................................... 79
4. Estudo das Correlaes ............................................................................................ 80
4.1. Relao entre o Nvel de Aderncia (NA) e as variveis independentes ............ 80
4.2. Relao entre o Nvel de Aderncia e o status diabtico com recurso ao R ....... 80
5. Anlise de Regresso Mltipla .................................................................................. 83
5.1. Regresso linear mltipla ................................................................................... 83
5.2. ANOVA para testar a significncia do modelo .................................................... 84
5.3. Validao dos pressupostos do modelo ............................................................. 85
5.4. Ajustamento do Modelo pelo Mtodo Stepwise .................................................. 88
5.5. Ajustamento do Modelo de RLM com recurso ao R ........................................... 94
6. Regresso Logstica .................................................................................................. 95
6.1 Introduo e Estratificao dos dados ................................................................. 95
6.2. Codificao de fatores ........................................................................................ 99
6.3. Qualidade do ajuste do modelo ......................................................................... 102
6.4. Anlise dos resduos ......................................................................................... 104
7. Concluso geral da anlise estatstica e recomendaes aos especialistas ............ 107
x
xi
NDICE DE TABELAS
Tabela 21 Coeficientes
xii
Tabela 24 Estatsticas Residuais
xiii
NDICE DE FIGURAS
Figura 2 Representao mltipla (grfico explicativo de uma funo preditora com trs
variveis)
Figura 16 Curva ROC, para uma dada capacidade de discriminao, com a variao do
critrio de deciso
Figura 18 Figura explicativa dos conceitos utilizados nas variveis clnicas do sistema
periodontal
xiv
Figura 22 Histogramas das variveis Idade, Escolaridade e IMC
Figura 33 QQ-plot
xv
NDICE DE ANEXOS
xvi
Modelos de Regresso: uma aplicao em Medicina Dentria
INTRODUO
O termo regresso foi usado, pela primeira vez, por Francis Galton num estudo sobre a
relao entre a altura dos pais e dos filhos e verificou que, mesmo havendo uma tendncia
para os pais altos terem filhos altos e os pais baixos terem filhos baixos, a altura mdia de
filhos tendia a deslocar-se, ou a regredir (da ter comeado a fazer uso deste termo) para a
altura mdia da populao.
A lei de regresso universal de Galton foi confirmada mais tarde por Karl Pearson, tendo este
recolhido mais de mil registos das alturas de indivduos pertencentes a grupos de famlias
altas e de famlias baixas, verificou que a altura mdia dos filhos de um grupo de pais altos
era inferior altura de seus pais e que a altura mdia dos filhos de um grupo de pais baixos
era superior altura de seus pais. Assim, tanto os filhos altos como os baixos regrediram
em direo altura mdia da populao. De acordo com Gujarati, A anlise de regresso
ocupa-se do estudo da dependncia de uma varivel, a varivel dependente, em relao a
uma ou mais variveis, as variveis explicativas, com o objetivo de estimar e/ou prever a
mdia (da populao) ou o valor mdio da dependente em termos dos valores conhecidos ou
fixos (em amostragem repetida) das explicativas (GUJARATI, 1996).
A anlise de regresso uma das tcnicas estatsticas mais utilizadas para pesquisar e
modelar a relao existente entre duas ou mais variveis, procura avaliar a existncia e o
grau de dependncia estatstica entre as variveis aleatrias, ou seja, aquelas que tm
distribuio de probabilidade. Enquanto a anlise de correlao consiste na medio do grau
ou intensidade de associao entre duas variveis. Quando se pode demonstrar que a
variao de uma varivel est de algum modo associada com a variao da outra, ento
podemos dizer que as duas variveis esto correlacionadas.
Existem vrios mtodos para construir uma equao de regresso, sendo o mtodo
dos mnimos quadrados o mais utilizado. Este mtodo, atribudo ao matemtico alemo Carl
Friedrich Gauss, tem algumas propriedades estatsticas que fizeram dele um dos mais
poderosos e populares mtodos para construir uma equao de regresso. A reta de
1
Modelos de Regresso: uma aplicao em Medicina Dentria
regresso obtida por este mtodo passa pela mdia da amostra dos valores das variveis
dependente e independente (X e Y), mostrando se elas realmente mantm alguma relao,
assim como se so positivamente ou negativamente correlacionadas e igualando a soma dos
seus desvios a zero.
Quando o estudo da anlise de regresso envolve situaes onde existem mais de uma
varivel explicativa esse modelo de regresso recebe o nome de Modelo de Regresso
Mltipla.
A regresso logstica semelhante regresso linear e usada quando temos uma varivel
dependente binria. O objetivo saber quais as variveis independentes que influenciam o
resultado (varivel dependente) e us-las numa equao para prever o resultado de um
indivduo custa das variveis independentes.
Neste trabalho pretendemos analisar alguns dados recolhidos no mbito de uma investigao
levada a cabo na rea da Medicina Dentria em que se avaliaram 158 indivduos, sendo 79
diabticos e 79 no diabticos, relativos a variveis bioqumicas, variveis antropomtricas,
fatores comportamentais e indicadores de sade oral.
A incluso das variveis que nos propomos avaliar neste trabalho so aquelas consideradas
como fatores de risco estabelecido para a periodontite. As variveis analticas relativas ao
perfil lipdico e glicemia no foram includas no modelo de estudo, que incluiu diabticos e
no diabticos, pois a dislipidemia e hiperglicemia so muito mais prevalentes e graves nos
doentes diabticos do que nos no diabticos. Porm, os dados analticos foram utilizados
em modelos que incluram apenas diabticos ou no diabticos.
2
Modelos de Regresso: uma aplicao em Medicina Dentria
Na anlise dos dados, sero aplicados mtodos de regresso a uma base de dados na rea
de Medicina Dentria. Assim, procurar-se- promover uma discusso a nvel metodolgico e
dos prprios resultados do estudo.
Por fim, sero apontadas as concluses mais pertinentes do estudo, bem como algumas
sugestes que se considerem adequadas. Ao proceder deste modo penso poder dar algum
contributo para a aplicao correta da estatstica em trabalhos biolgicos, alertando para que
a anlise estatstica tem de ser adequada e os resultados devem ser devidamente
interpretados.
3
Modelos de Regresso: uma aplicao em Medicina Dentria
PARTE I
4
Modelos de Regresso: uma aplicao em Medicina Dentria
A ANOVA uma tcnica poderosa que envolve a partio estatstica da varincia observada
em diferentes componentes para realizar vrios testes de significncia. No nosso estudo
aplicamos a ANOVA a um conjunto de dados para avaliar se existe uma relao linear entre
uma varivel dependente e uma varivel independente e comparar mdias entre grupos
(diabticos e no diabticos). Tambm recorremos ANOVA para avaliar a qualidade do
ajuste dos modelos construdos.
5
Modelos de Regresso: uma aplicao em Medicina Dentria
Segundo o excerto do Studies in Crop Variation: An examination of the yield of dressed grain
from Broadbalk, Journal of Agriculture Science, 11, 107-135, 1921, a variao de qualquer
quantidade (varivel) que resulta de duas ou mais causas independentes funo da soma
dos valores da varincia produzida por cada causa separadamente. Esta propriedade da
varincia, pela qual cada causa independente, por si s, contribui para o total, permite-nos
analisar o total, e atribuir, aproximadamente, as diferentes pores s causas apropriadas (ou
grupo de causas).
O modelo deve ser aditivo, isto , os efeitos devem-se somar (no h interao);
Os erros (eij) devem ter distribuio normal;
Os erros (eij) devem ser independentes;
Os erros (eij) devem ter a mesma varincia, ou seja, deve existir homocedasticidade.
Para testar a hiptese H0, pode utilizar-se o teste F apresentado numa tabela de Anlise de
Varincia. Convm lembrar que esse teste s vlido se os pressupostos assumidos para os
erros do modelo estiverem satisfeitos.
Se Fcalculado > Ftabelado, rejeita-se a hiptese de nulidade H0, ou seja, existem evidncias de
diferena significativa entre pelo menos um par de mdias de tratamentos, ao nvel de
significncia escolhido.
6
Modelos de Regresso: uma aplicao em Medicina Dentria
As principais diferenas entre estes dois tipos de testes podem ser sintetizadas da seguinte
forma:
7
Modelos de Regresso: uma aplicao em Medicina Dentria
Testes no paramtricos:
Paramtricos No Paramtricos
Distribuio assumida Normal Qualquer uma
Varincia assumida Homognea Qualquer uma
Tipo de variveis normalmente
De intervalo ou rcio Ordinal ou nominal
usadas
Relao entre os dados Independentes Qualquer uma
Medidas de localizao central
Mdia Mediana
normalmente usadas
Quando precisamos de optar por um determinado tipo de teste devemos ter em conta o tipo
de dados do estudo e qual o objetivo do estudo (o que pretendemos avaliar).
8
Modelos de Regresso: uma aplicao em Medicina Dentria
TIPO DE DADOS
9
Modelos de Regresso: uma aplicao em Medicina Dentria
pares
Teste da mediana
Teste de Mann-Whitney
Teste de
Teste de Fisher ou Teste de Kolmogorov-Smirnov
Amostras aleatoriedade para 2
Teste de Qui- para duas amostras
independentes amostras
quadrado Teste de Wald independentes
Teste de Moses para reaes
extremas
Amostras Teste Q de
Teste de Friedman
emparelhados Cochran
K amostras
Teste de Qui-
Amostras quadrado
Teste de Kruskal-Wallis
independentes (para k amostra
independentes)
Adaptado de Siegel (1975)
O teste do Qui-quadrado permite verificar a independncia entre duas variveis, tendo por
base uma disposio dos dados de acordo com uma tabela de contingncia do tipo x .
Genericamente, uma tabela de contingncia resulta de uma classificao, segundo dois itens
diferentes, de um mesmo grupo de indivduos. Tem por objetivo inferir sobre a existncia ou
inexistncia de relao entre as variveis.
10
Modelos de Regresso: uma aplicao em Medicina Dentria
Hipteses a testar
A formalizao do teste de hipteses, com a definio das hipteses nula e alternativa, ser
apresentada da seguinte forma:
Total
Total
Onde:
Sendo: , com e
Estatstica de teste
Regra de deciso
11
Modelos de Regresso: uma aplicao em Medicina Dentria
Teste de Mann-Whitney
Foi desenvolvido por F. Wilcoxon em 1945 para comparar as tendncias centrais de duas
amostras independentes de tamanhos iguais. Em 1947, H. B. Mann e D. R. Whitney
generalizaram a tcnica para amostras de tamanhos diferentes e passou a ser conhecido
como o teste de Mann-Whitney. Este teste pois um substituto do teste t de Student e
aplicvel quando se verificam os seguintes pressupostos:
Amostras aleatrias
Observaes independentes
Varivel de interesse tem caratersticas contnua (mesmo que os dados no sejam
contnuos)
Hipteses a testar
12
Modelos de Regresso: uma aplicao em Medicina Dentria
Estatstica de teste
A estatstica de teste baseia-se nas ordens (ranks) das observaes das amostras.
Combinam-se as duas amostras, o total das observaes e ordenam-se estas por ordem
crescente assinalando o grupo a que pertencem. No caso das observaes empatadas
atribui-se a mdia dada pela posio sequencial das observaes que lhe corresponderiam.
Em que: e
Regra de deciso
Se , ento pertence regio crtica, pelo que se rejeita a hiptese nula ao nvel
de significncia .
13
Modelos de Regresso: uma aplicao em Medicina Dentria
O teste Mann-Whitney pode ser aplicado em situaes em que existem empates nas
observaes e em situaes em que no ocorrem empates.
No caso em que ocorrem empates entre duas ou mais observaes da mesma amostra, o
valor de no afetado. Mas se os empates envolvem elementos das duas amostras e
ocorrem entre duas ou mais observaes, o valor de pode ser afetado. A correo para
empates deve ser feita ao desvio padro da distribuio amostral .
Teste de Kruskal-Wallis
Para alm disto, a anlise de varincia paramtrica s pode ser aplicada quando a varivel
dependente admite pelo menos a escala de intervalos como nvel de medida. Quando no se
verificam os pressupostos da anlise de varincia paramtrica e/ou quando o nvel de medida
mais restrito da varivel dependente a escala ordinal, o teste de Kruskal-Wallis que uma
generalizao, para k>2 amostras, do teste de Mann-Whitney. Pode ser considerado como a
alternativa no paramtrica ANOVA one-way (KRUSKAL e WALLIS,1952). Este teste
destina-se a verificar se h diferenas na localizao das populaes (com distribuies
contnuas) subjacentes aos n grupos.
14
Modelos de Regresso: uma aplicao em Medicina Dentria
Hipteses a testar
A ideia base do teste a de que, se for verdadeira, os ranks correspondentes aos vrios
grupos estaro misturados de forma aleatria; caso contrrio, devero existir grupos com
predominncia de ranks reduzidos e outros grupos com predominncia de ranks elevados.
O teste de Kruskal-Wallis baseia-se na comparao entre a mdia dos valores de ordem das
diversas amostras e no na comparao entre as mdias amostrais da varivel dependente,
uma vez que nem sempre possvel calcular as mdias amostrais (esse clculo s possvel
quando as variveis dependentes admitem como nvel de medida mais restrito a escala de
intervalos).
( ) da populao
Estatstica de teste
15
Modelos de Regresso: uma aplicao em Medicina Dentria
Onde
Para o caso de no existirem empates (ou de o seu nmero ser muito pequeno), esta
estatstica reduz-se a:
Esta aproximao ser tanto melhor quanto maiores forem as amostras e a dimenso de
cada amostra.
Regra de deciso
Quando existem observaes com o mesmo valor (empates), importante corrigir o valor do
teste. Se mais de 25% das observaes forem empates, a estatstica de teste T dever ser
corrigida dividindo T por:
16
Modelos de Regresso: uma aplicao em Medicina Dentria
2) Se pelo menos uma das amostras tiver dimenso , deve usar-se a distribuio do
Qui-quadrado. Se , ento rejeita-se ao nvel de significncia .
Se o valor observado da estatstica de teste pertencer regio crtica ento isso significa que
existem diferenas significativas entre as amostras.
Para identificar onde se situa a diferena necessrio proceder a comparaes dos grupos,
dois a dois, o que corresponde a efetuar testes.
Isto , a primeira desigualdade ser superior segunda se existirem diferenas entre o grupo
e o . Assim, corresponde ao valor da probabilidade de uma varivel aleatria
Teste de Kolmogorov-Smirnov
17
Modelos de Regresso: uma aplicao em Medicina Dentria
Hipteses a testar
Este teste observa a mxima diferena absoluta entre a funo de distribuio acumulada
assumida para os dados, no caso a normal, e a funo de distribuio emprica dos dados.
Como critrio, comparamos esta diferena com um valor crtico, para um dado nvel de
significncia.
18
Modelos de Regresso: uma aplicao em Medicina Dentria
Estatstica de teste
Regra de deciso
Se maior que o valor crtico, rejeitamos a hiptese de normalidade dos dados com
de confiana. Caso contrrio, no rejeitamos a hiptese de normalidade.
Teste de Wald
Hipteses a testar
19
Modelos de Regresso: uma aplicao em Medicina Dentria
Estatstica de teste
Teste de Fisher
Neste caso prefervel usar o teste exato de Fisher, que passaremos a descrever. Neste
teste basemo-nos no clculo da distribuio de probabilidade das frequncias da tabela.
Contudo isso no possvel na situao das tabelas com margens livres ou com uma
margem fixa e outra livre, porque a probabilidade de uma dada distribuio das frequncias
funo de parmetros de valor desconhecido.
Varivel Coluna
Total
1 2
1 A B A+B
Varivel linha
2 C D C+D
20
Modelos de Regresso: uma aplicao em Medicina Dentria
Teste de Spearman
O teste de Spearman considera uma populao da qual foi retirada uma amostra de
dimenso n de pares ordenados de duas variveis aleatrias x e y. Considera ainda que as
mesmas variveis so ordenadas de forma crescente e lhes atribudo um nmero de
ordem. Estas variveis podem encontrar-se associadas de uma forma direta ou de uma forma
inversa como se mostra na tabela seguinte:
21
Modelos de Regresso: uma aplicao em Medicina Dentria
A B
Varivel x Varivel y Varivel x Varivel y
(N de ordem) (N de ordem) (N de ordem) (N de ordem)
1 1 1 n
2 2 2 n-1
n-1 n-1 n-1 2
n n n 1
O coeficiente assume o valor 1 quando entre o conjunto das observaes existe uma
associao direta perfeita e assume o valor -1 quando se verificar uma associao inversa
perfeita. Quando no se verificar qualquer associao entre as variveis x e y, o coeficiente
assume valores prximos de zero.
Hipteses a testar
A partir deste coeficiente pode ser construdo um teste bilateral para testar em que:
Estatstica do teste
Quando a amostra for superior a 30 observaes, a estatstica de teste dever ser substituda
por:
Quando verdadeira, segue uma distribuio t de Student com (n-2) graus de liberdade.
22
Modelos de Regresso: uma aplicao em Medicina Dentria
Sendo
23
Modelos de Regresso: uma aplicao em Medicina Dentria
3. Anlise de Regresso
O modelo linear normal, criado no incio do sculo XIX por Legendre e Gauss, dominou a
modelao estatstica at meados do sculo XX, embora vrios modelos no lineares ou no
normais tenham entretanto sido desenvolvidos para fazer face a situaes que no eram
adequadamente explicadas pelo modelo linear normal.
So exemplo disso, tal como referem McCULLAGH and NELDER (1989) e LINDSEY (1997),
o modelo complementar log-log para ensaios de diluio (Fisher, 1922), os modelos probit
(BLISS, 1935) e logit (BERKSON, 1944; DYKE and PATTERSON, 1952; RASCH, 1960) para
propores, os modelos log-lineares para dados de contagens (BIRCH,1963), os modelos de
regresso para anlise de sobrevivncia (FEIGL and ZELEN, 1965; ZIPPIN and ARMITAGE,
1966; GLASSER, 1967).
Anlise de regresso uma tcnica de modelao utilizada para analisar a relao entre uma
varivel dependente ( ) e uma ou mais variveis independentes . O objetivo
desta tcnica identificar e estimar uma funo que descreva, o mais prximo possvel, a
24
Modelos de Regresso: uma aplicao em Medicina Dentria
relao entre essas variveis e que assim ir permitir predizer o valor que a varivel
dependente ( ) ir assumir para um determinado valor da varivel independente .
A correlao entre duas variveis determinada numericamente por meio dos coeficientes de
correlao que representam o grau de associao entre duas variveis contnuas e designa-
se por .
x,y =
25
Modelos de Regresso: uma aplicao em Medicina Dentria
A estatstica do teste
no significativo significativo
no significativamente diferente de significativamente diferente de
(a reta paralela ao eixo dos ) (a reta no paralela ao eixo dos )
26
Modelos de Regresso: uma aplicao em Medicina Dentria
Um modelo de regresso linear simples (MRLS) descreve uma relao entre uma varivel
independente (explicativa ou regressora) e uma varivel dependente (resposta) , nos
termos seguintes:
(1)
27
Modelos de Regresso: uma aplicao em Medicina Dentria
O diagrama de disperso um grfico constitudo por pontos onde cada ponto, P i, representa
um par de valores observados, (xi, yi), (xi representa o valor da varivel independente
observada para o indivduo Pi e yi representa o valor da varivel dependente observada para
esse mesmo indivduo). O diagrama de disperso obtido pelos pontos posicionados em
torno da reta de regresso.
O diagrama de disperso tem uma funo dupla: analisar se existe alguma associao entre
as variveis e permitir identificar qual o modelo matemtico (equao) mais apropriado para
descrever essa associao.
Quando o diagrama de disperso indica uma tendncia para uma relao linear, ento os
dados encontram-se bem ajustados pela reta de regresso (de equao (1)).
Ao ajustar uma reta de regresso aos dados observados anulamos os efeitos da varivel
residual. Verifica-se que nem todos os pontos se encontram sobre a reta e essa diferena o
erro (), que pode ter sido ocasionado por fatores distintos. Mas supe-se que a mdia
desses erros tende a anular-se, ou seja: .
A obteno da reta ajustada implica o conhecimento dos parmetros 0 e 1 de tal modo que
o desvio entre os valores reais e os valores ajustados seja mnimo. Um mtodo que permite
minimizar estes desvios o mtodo dos mnimos quadrados.
Uma vez escolhido o modelo de regresso, deve-se estimar os seus parmetros, neste caso
os coeficientes da equao da reta, e . Isso pode ser feito a partir da aplicao do
Mtodo dos Mnimos Quadrados. Calculando a mdia sobre a equao (1), temos:
(2)
(3)
(desvios)
28
Modelos de Regresso: uma aplicao em Medicina Dentria
(4)
ou (5)
Como o objetivo estimar uma equao que minimize os erros, devemos ento derivar a
equao acima em relao a e igualar a zero. Como os verdadeiros valores so
desconhecidos e apenas conhecemos os valores de uma amostra, ou seja o valor a ser
determinado um estimador do verdadeiro valor populacional, a nova nomenclatura para
ser . Com isso temos:
(6)
(7)
(8)
) (9)
29
Modelos de Regresso: uma aplicao em Medicina Dentria
So pontuais;
A linha de regresso amostral dada por: ;
O valor mdio do resduo zero;
Os resduos so no correlacionados com e .
Coeficiente de determinao
Ora: (10)
(11)
O primeiro membro desta equao pode ser interpretado como proporcional varincia total
de , enquanto o segundo membro reflete a soma de termos proporcionais s suas
varincias residuais e explicada pelo modelo de regresso. Esta equao (11) pode ser
escrita da seguinte forma:
(12)
O coeficiente de determinao dado pela relao entre a soma dos quadrados devidos
regresso ( ) e a soma dos quadrados ( ), ou seja
(13)
30
Modelos de Regresso: uma aplicao em Medicina Dentria
(14)
Outra medida simples de calcular o coeficiente de varincia, bastante til para comparar
modelos diferentes e dado pela frmula:
(15)
As verificaes das suposies supracitadas so feitas atravs da anlise dos resduos que,
segundo MAROCO (2007), consiste em avaliar os pressupostos de:
31
Modelos de Regresso: uma aplicao em Medicina Dentria
O modelo de regresso linear simples seria ideal se todos os pontos da amostra estivessem
sobre a reta ajustada. Porm difcil tal acontecer e torna-se importante avaliar a medida da
variabilidade dos pontos amostrais em relao reta.
(16)
Uma estimativa no enviesada da varincia dos resduos em torno da reta de regresso pode
ser obtida por:
n 2 n 2
2 i 1 ei
e s2e i 1 i i
(17)
n 2 n 2
n 2
i 1 i i
e se n 2
(18)
uma forma de dividir a varincia total em componentes, neste caso, devido a regresso e
ao resduo ( ). Tem o objetivo de verificar se a parte da variao total explicada
pelo modelo (regresso) significativamente diferente de zero. Na ANOVA as varincias so
denominadas quadrados mdios (QM) e obtm-se pela diviso da soma dos quadrados pelos
graus de liberdade. Seja QM o quadrado mdio, QMREG os quadrados mdios obtidos pela
regresso e QMRES os quadrados mdios devidos aos resduos.
32
Modelos de Regresso: uma aplicao em Medicina Dentria
Regresso
Resduos Erros
Total
Portanto, a hiptese nula deve ser rejeitada se o valor calculado for superior ao valor crtico.
Devido variabilidade amostral, a reta de regresso obtida da amostra uma das retas
possveis. Os valores calculados para e so estimativas pontuais dos parmetros
populacionais e . As retas da populao e da amostra so paralelas quando e
tero apenas um ponto necessariamente coincidente, a saber, a mdia das amostras, quando
.
33
Modelos de Regresso: uma aplicao em Medicina Dentria
(19)
(20)
No clculo de e tem-se:
(21)
Onde:
o tamanho da amostra
a mdia da varivel independente
o valor observado da varivel independente
(22)
donde
(23)
(24)
graus de liberdade.
de notar que a amplitude do intervalo de confiana ser mnima quando for igual ao valor
mdio da amostra utilizada na definio da equao da reta de regresso e ser tanto maior
quanto mais distante estiver da mdia.
34
Modelos de Regresso: uma aplicao em Medicina Dentria
Muitas aplicaes da anlise de regresso envolvem situaes com mais do que uma
varivel explicativa. Esse modelo de regresso recebe o nome de modelo de regresso
mltipla (MRLM).
Assim se h uma nica varivel preditora , a funo descreve uma linha reta. Se houver
duas variveis preditoras, ento a funo descreve um grfico no plano. Se existem n
variveis preditoras, ento a funo descreve um hiperplano n-dimensional, como se
encontra na figura 2.
Figura 2: Representao mltipla (grfico explicativo de uma funo preditora com trs variveis)
35
Modelos de Regresso: uma aplicao em Medicina Dentria
(25)
(26)
(27)
Pela equao (27), h necessidade que o produto tenha uma matriz inversa, o que
implica a condio obrigatria que nenhuma coluna da matriz seja combinao linear das
outras.
(28)
36
Modelos de Regresso: uma aplicao em Medicina Dentria
Este teste conhecido como teste do total. A estatstica do teste a relao entre a
varincia decorrente da regresso linear mltipla e a varincia dos resduos:
(29)
(30)
37
Modelos de Regresso: uma aplicao em Medicina Dentria
A hiptese nula deve ser rejeitada se a estatstica for maior ou igual ao valor critico da
distribuio de Snedecor,
ou seja, rejeita-se se
(31)
(32)
38
Modelos de Regresso: uma aplicao em Medicina Dentria
(33)
Ao ajustar uma equao de regresso aos dados, na maioria das vezes o valor observado de
y no corresponde exatamente ao valor predito de y. A esta diferena chamamos de resduos
ou variao residual.
(34)
(35)
Nas situaes multifatoriais reais deparamo-nos com fatores que atuam efetivamente sobre a
varivel resposta influenciando-a, enquanto outros no, agindo apenas como fatores de
confuso. Assim, com o objetivo de se interpretar corretamente os fenmenos, devemos
utilizar modelos que considerem a ao conjunta de variveis. Para modelar estes
39
Modelos de Regresso: uma aplicao em Medicina Dentria
fenmenos, que envolvem uma varivel dependente categrica (nominal) e vrias variveis
independentes mtricas ou categricas, necessitamos de selecionar um mtodo estatstico
apropriado, que nestas situaes so a anlise discriminante e a regresso logstica.
As variveis dependentes categricas, como por exemplo: qualidade de vida (QOL, Quality of
Life), indicadores da condio de sade, gravidade da doena, etc. utilizadas em estudos
epidemiolgicos podem ser ordenadas na forma de score (k valores). Se as variveis
dependentes so discretas, inadequado inclui-las no modelo como se fossem variveis
escalares, devendo-se utilizar variveis de design (ou dummy), ou seja se uma varivel
discreta com valores possveis, ento representaremos cada um deles por uma varivel
dummys, obtendo um modelo com variveis dummy. Estes modelos, dependendo do
delineamento do estudo, permitem tambm calcular a estatstica odds ratio (or) ou a
probabilidade de ocorrncia de um evento ( ).
Seja Y uma varivel aleatria dummy definida como; , onde cada tem distribuio
de Bernoulli, cuja funo de distribuio de probabilidade dada por;
A funo de ligao deste modelo linear generalizado dada pela seguinte equao:
40
Modelos de Regresso: uma aplicao em Medicina Dentria
- Os preditores no so multicolineares
41
Modelos de Regresso: uma aplicao em Medicina Dentria
, com .
Igualando as equaes das funes derivadas, em relao aos parmetros a zero obtemos
e que so equaes no lineares nos parmetros e
requerem o emprego de processo interativo na sua soluo.
Odds ratio
ou
42
Modelos de Regresso: uma aplicao em Medicina Dentria
Na rea da sade (campo do nosso estudo) o or, como definida anteriormente permite-nos
relacionar a ocorrncia de um evento entre indivduos expostos ( ) e no expostos ( )a
determinado fator de risco.
Inferncia
43
Modelos de Regresso: uma aplicao em Medicina Dentria
o modelo completo
Assim o valor de G2, obtm-se a partir do rcio das verosimilhanas de dois modelos e
uma medida de incremento da qualidade do modelo nulo por adio das variveis
independentes. Logo o modelo completo estatisticamente significativo apenas quando a
adio de uma ou mais variveis independentes ao modelo, reduz significativamente o valor
de -2LL.
de realar que concluir que o modelo completo significativo, permite apenas afirmar que
pelo menos uma varivel independente includa no modelo influencia significativamente a
varivel dependente como ajustado pelo modelo.
J o teste de Score tem como principal vantagem o uso de pequeno esforo computacional
no seu clculo. Este teste baseado na teoria da distribuio das derivadas do log da
mxima verosimilhana.
Para avaliar a qualidade do ajuste de modelos logsticos, foram desenvolvidos vrios pseudo-
r2.
44
Modelos de Regresso: uma aplicao em Medicina Dentria
2
Quadro sntese dos pseudo-r
2
Este pseudo-r ajusta o de modo que varie
Pseudo-R 2 entre 0 e 1.
Se L(MCompleto) = 1, ento = 1;
Se L(MCompleto) = L(Minterc), ento = 0.
45
Modelos de Regresso: uma aplicao em Medicina Dentria
Estes mtodos distiguem-se pelo que aontece variabilidade devida ao efeito comum das VI
(quando esto correlacionadas entre si) e pelos critrios da ordem de entrada das VI na
equao. Esquematicamente podemos visualizar estes trs mtodos no esquema seguinte:
46
Modelos de Regresso: uma aplicao em Medicina Dentria
47
Modelos de Regresso: uma aplicao em Medicina Dentria
Quando um grfico elaborado, um dos elementos mais importantes a ter em conta a sua
perceo, porque permite dar uma fundamentao cientfica sua construo e sustentar a
escolha de uma forma em detrimento de outra. Na fase da construo, a informao
codificada no grfico atravs de smbolos, comprimentos, declives dos segmentos de reta,
reas, textura ou cor. Quando um grfico analisado, a informao nele contida
descodificada pelo analista, sendo o processo de descodificao denominado de perceo
grfica, que permite avaliar a capacidade de um grfico transmitir informao (CLEVELAND,
MCGILL, 1987). A extrao de informao a partir dos grficos envolve tarefas percetivas
realizadas pelo sistema visual olho-crebro. No quadro seguinte, estas tarefas esto
ordenadas segundo a preciso na extrao de informao quantitativa. Quanto menos
precisa for a perceo, maior o erro de leitura, ou seja, maior a diferena entre o valor
percebido e o valor correto.
Localizao com utilizao dum referencial cartesiano que atribui a um ponto determinadas
coordenadas;
48
Modelos de Regresso: uma aplicao em Medicina Dentria
Textura tamanho e espaamento dos elementos grficos que constituem o smbolo (pontos,
linhas ou outros), expresso pelo nmero desses elementos que se repetem por unidade de
comprimento;
Orientao tambm designada por direo, corresponde ao ngulo do smbolo com a linha
de leitura (referencial);
Citando DINIS PESTANA, na minha investigao uso os grficos com uma parcimnia que
ronda a avareza, e creio que apenas publiquei grficos em trabalhos de ndole didtica.
Grficos de construo simples podem ser inspiradores, mas de modo nenhum substituem
uma anlise assente em mtodos decerto menos apelativos, mas mais seguros. Os grficos
so mais prprios da anlise exploratria de dados do que da anlise estatstica
confirmatria, que decerto merece um estatuto de maior relevo.
49
Modelos de Regresso: uma aplicao em Medicina Dentria
Regresso Linear
50
Modelos de Regresso: uma aplicao em Medicina Dentria
Figura 6: Exemplos de relao conjunta entre variveis (adaptado de HELSEL e HIRSH, 1992)
A independncia de resduos pode ser verificada com grficos em relao varivel prevista,
Y.
A figura seguinte ilustra duas situaes: uma onde se verifica a independncia dos resduos e
a outra onde se observa a ocorrncia de dependncia.
Tambm a hiptese de varincia constante no MRLS pode ser verificado por meio de anlise
grfica entre os resduos e a varivel dependente X, como se ilustra na figura seguinte, que
apresenta situaes em que existe a violao de varincia constante.
51
Modelos de Regresso: uma aplicao em Medicina Dentria
52
Modelos de Regresso: uma aplicao em Medicina Dentria
53
Modelos de Regresso: uma aplicao em Medicina Dentria
Outro cuidado que se deve ter na anlise de duas variveis com a ocorrncia de
correlaes aparentes (em que as variveis no esto correlacionadas). As causas mais
frequentes desta ocorrncia so: a distribuio no equilibrada dos dados (figura 12); a
relao entre quocientes de variveis que apresentam o mesmo denominador (figura 13); e a
relao de variveis que foram multiplicadas por uma delas (figura 14).
54
Modelos de Regresso: uma aplicao em Medicina Dentria
O primeiro passo que dever ser dado para verificar se os dados provm duma populao
com uma determinada distribuio consiste numa comparao grfica dos dados com a
distribuio terica. Uma das formas consiste em recorrer aos grficos de probabilidade P-P
Plot e Q-Q Plot. Existem dois tipos de grficos de probabilidade normal: o Normal P-P Plot,
que representa a probabilidade acumulada que seria de esperar se a distribuio fosse
normal, em funo da probabilidade observada acumulada dos erros; e o Normal Q-Q Plot,
que representa o quantil de probabilidade esperado se a distribuio fosse normal em funo
dos resduos.
Para elaborar estes grficos, comea-se por estandardizar os resduos de forma a terem um
desvio padro unitrio:
55
Modelos de Regresso: uma aplicao em Medicina Dentria
O valor da funo de distribuio para cada resduo estandardizado, assumindo que tem
distribuio normal, representado no eixo das ordenadas e a probabilidade observada
acumulada obtida atravs da frmula vai ser o valor da abcissa.
O P-P Plot faz corresponder a funo de distribuio terica com a funo de probabilidade
acumulada observada nos dados.
O Q-Q Plot faz corresponder os quantis esperados com os quantis observados nos dados.
Se os erros possurem distribuio normal, todos os pontos dos grficos devem posicionar-se
mais ou menos sobre uma reta. Logo se os dados seguirem a distribuio terica esperada
os grficos sero aproximadamente lineares.
56
Modelos de Regresso: uma aplicao em Medicina Dentria
Na figura 15 observa-se que o primeiro par de grficos evidencia uma curvatura relativamente
reta, o que indicador de enviesamento, donde somos levados a concluir que a distribuio
no normal. J no segundo par tal no acontece, evidenciando uma distribuio normal.
Curva ROC
Uma prtica comum na rea relacionada com a medicina a forma de se descrever como e
quanto uma varivel contnua ou categrica ordinal capaz de classificar materiais ou
indivduos em grupos definidos.
A anlise ROC (Receiver Operating Characteristc) uma ferramenta que permite medir e
especificar problemas no desempenho do diagnstico em medicina. Pode ser feita por meio
de um grfico simples e robusto, que nos permite estudar a variao da sensibilidade e
especificidade, para diferentes valores de corte.
57
Modelos de Regresso: uma aplicao em Medicina Dentria
De outra forma, pode-se dizer que as curvas ROC foram desenvolvidas no ramo das
comunicaes como uma forma de demonstrar as relaes entre sinal-rudo. Neste sentido,
podemos interpretar o sinal como os verdadeiros positivos (sensibilidade) e o rudo como os
falsos positivos (1 especificidade)
A curva ROC um grfico de Sensibilidade (ou taxa de verdadeiros positivos) versus taxa de
falsos positivos, ou seja, representa-nos a Sensibilidade (ordenadas) e 1 Especificidade
(abcissas) resultantes da variao de um valor de corte ao longo do eixo de deciso x
(BRAGA, 2000).
Assim, a representao da curva ROC permite evidenciar os valores para os quais existe
otimizao da Sensibilidade em funo da Especificidade, correspondente ao ponto que se
encontra mais prximo do canto superior esquerdo do diagrama, uma vez que o indcio de
verdadeiro positivo 1 e o de falso positivo 0.
Figura 16: Curva ROC, para uma dada capacidade de discriminao, com a variao do critrio de
deciso (BRAGA (2000))
O valor do ponto de corte definido como um valor que pode ser selecionado arbitrariamente
pelo investigador entre os valores possveis para a varivel de deciso, acima da qual o
paciente classificado positivo e abaixo do qual classificado como negativo.
De acordo com Braga (2000), para cada ponto de corte so calculados valores de
Sensibilidade e Especificidade; estes valores podem assim ser dispostos no grfico. Um
58
Modelos de Regresso: uma aplicao em Medicina Dentria
Odds Ratio
Figura 17: Grfico de mosaico correspondente tabela de contingncia de 22. O grfico da esquerda
relaciona as duas variveis binrias com o log odds. Os valores de log odds variam entre -2 e 2.
Com base na "leitura" de valores de uma representao grfica no podemos obter nmeros
precisos, procuramos somente uma avaliao aproximada. No caso dos rcios de
probabilidade log vamos poder observar algumas das seguintes propriedades:
Igualdade das alturas de azulejos corresponde a valores de odds ratio prximos de zero
(indicando independncia estatstica nos valores subjacentes).
Comparaes entre vrios mosaicos permitem avaliar a fora das associaes (mais
fraca e mais forte).
A comparao do tamanho dos azulejos permite-nos afirmar que: o odds ratio parece ser
idntico" em duas parcelas; ou "um odds ratio de cerca de x vezes superior a outro",
onde x um mltiplo inteiro pequeno.
59
Modelos de Regresso: uma aplicao em Medicina Dentria
Assim, entendemos ser pertinente neste ponto do trabalho, e antes de iniciarmos a parte
prtica da aplicao, proceder a uma breve reviso de conceitos importantes nas reas da
diabetes mellitus e da periodontite, bem como das suas relaes.
60
Modelos de Regresso: uma aplicao em Medicina Dentria
Neste estudo vamos recorrer a um grupo de variveis que melhor representam o estado de
higiene oral e de sade periodontal, sendo por isso as mais frequentemente usadas na clnica
periodontal.
Para calcular o IP, dos seis pontos observados em torno de cada dente trs pontos
vestibulares (msio-vestibular, vestibular e disto-vestibular) e trs pontos linguais (msio-
lingual, lingual e disto-lingual) foram contabilizados apenas quatro: um mesial (vestibular ou
lingual), um distal (vestibular ou lingual), o ponto intermdio vestibular e o ponto intermdio
lingual. Foi determinado o nmero total de pontos que apresentaram placa bacteriana e
dividido pelo nmero total de pontos considerados para este efeito, sendo o resultado
apresentado como percentagem.
Os pontos considerados com placa bacteriana foram aqueles que coraram aps a aplicao
do revelador de placa (eritrosina) e os que, apesar de no terem corado, apresentaram
pigmentao superficial e/ou clculo dentrio, ou apresentaram placa que se conseguiu
destacar com a ponta da sonda.
61
Modelos de Regresso: uma aplicao em Medicina Dentria
A retrao gengival corresponde distncia entre a margem da gengiva livre e a linha amelo-
cementria, tomando-se esta medida nos seis pontos correspondentes aos pontos de
sondagem. Sempre que necessrio procedeu-se aproximao pelo mtodo j referido.
Figura 18: Figura explicativa dos conceitos utilizados nas variveis clnicas do sistema periodontal
62
Modelos de Regresso: uma aplicao em Medicina Dentria
63
Modelos de Regresso: uma aplicao em Medicina Dentria
PARTE II
64
Modelos de Regresso: uma aplicao em Medicina Dentria
1. Introduo
Atualmente esto em foco as interaes entre doenas locais e doenas sistmicas, entre as
quais, pela sua importncia como problema de sade pblica e pelas suas graves
consequncias socioeconmicas, se destaca a diabetes mellitus. A sua prevalncia tem
aumentado ao longo das ltimas dcadas acompanhando as modificaes dos estilos de vida
das sociedades modernas e com ela as doenas relacionadas, como por exemplo a doena
cardiovascular e a periodontite. Por outro lado, a doena periodontal tem implicaes a nvel
da inflamao sistmica, havendo dados que sugerem estar esta doena implicada em
alteraes no equilbrio metablico dos doentes diabticos. O estado atual do conhecimento
neste campo da sade, relao entre doena sistmica e doena periodontal, fornece a
plausibilidade biolgica para a realizao deste estudo, que aborda esta associao com
ajustamento a outros fatores tambm relacionados com estas mesmas doenas.
Os dados que iremos utilizar neste estudo foram extrados duma base de dados mais
abrangente obtida num estudo clnico realizado no campo da medicina dentria e
endocrinologia. Tal estudo foi aprovado pela Comisso de tica da Faculdade de Medicina
Dentria da Universidade do Porto e pela Comisso de tica do Hospital de S. Joo, e todos
os participantes assinaram uma declarao de consentimento informado, conforme a
Declarao de Helsnquia da Associao Mdica Mundial.
Alguns dos aspetos metodolgicos desse estudo clnico merecem ser mostrados neste
trabalho para contextualizar os dados que iremos tratar (PEREIRA, J. (2007)).
65
Modelos de Regresso: uma aplicao em Medicina Dentria
O grupo de diabticos foi constitudo por 79 indivduos com idades compreendidas entre os
18 e os 79 anos (mdia = 50,57 (desvio padro 15,2)), sendo 38 do sexo masculino (48,1%) e
41 do sexo feminino (51,9 %), e foram selecionados consecutivamente a partir dos indivduos
que frequentaram a Consulta de Endocrinologia do Hospital de S. Joo e aceitaram deslocar-
se Faculdade de Medicina Dentria U.Porto para serem examinados por um mdico
dentista.
66
Modelos de Regresso: uma aplicao em Medicina Dentria
As variveis utilizadas nos modelos foram estratificadas conforme a sua associao com a
doena periodontal tendo em conta os seguintes fatores:
Gnero
Idade >50
Os indivduos com idades superiores a 50 anos tm maior risco para a perda de osso
alveolar, passando a taxa anual de perda de aderncia de 0,1 mm/ano at aos 35 anos para
0,3 mm/anos aps os 50 anos de idade (AXELSSON et al., 1978). Esta alterao na taxa de
progresso da doena pode ser justificada por alteraes da imunidade inata e adaptativa
associadas com o envelhecimento (PANDA et al., 2009) e reduo dos nveis dos esterides
sexuais nos homens (ORWOL et al., 2009) e nas mulheres ps menopausa (MARKOU et al.,
2009).
IP >90
IMC <25
67
Modelos de Regresso: uma aplicao em Medicina Dentria
Tabaco
68
Modelos de Regresso: uma aplicao em Medicina Dentria
Metedologias estatsticas
adotadas para responder s
questes colocadas
Anlise
Anlise Bivariada t-Teste Discriminante
Anlise Regresso
Multivariada ANOVA Linear Mltipla
Regresso
Logstica
69
Modelos de Regresso: uma aplicao em Medicina Dentria
Foi construdo um modelo de Regresso Linear para determinar a influncia das variveis
Status Diabtico, Sexo, Idade, Escolaridade e ndice de Placa no Nvel de Aderncia. Para
avaliar o ajustamento do modelo recorremos ANOVA, cujos pressupostos normalidade,
multicolinearidade e homocedasticidade foram avaliados graficamente pelos testes do SPSS:
Kolmogorov-Smirnov, de VIF e de tolerncia. Tambm recorremos ao package Design no R.
70
Modelos de Regresso: uma aplicao em Medicina Dentria
escolha deste teste deve-se ao facto de nos permitir avaliar em simultneo hipteses sobre
vrias combinaes lineares dos parmetros.
As ferramentas computacionais usadas neste trabalho foram o SPSS (Statistical Package for
the Social Sciences) verso 18, e o R.
A utilizao destes dois softwares foi justificada pelas razes que passamos a descrever:
O SPSS um dos softwares mais utilizados em diferentes reas do saber pois possui um
ambiente grfico muito apelativo e de utilizao intuitiva, bastando para a maioria das
anlises efetuar a seleo das respetivas opes em menus e caixas de dilogos. Alm disso
permite tratar variveis de diferentes tipos e permite desenvolver todo o processo da
investigao, desde o planeamento do estudo at ao tratamento de dados para a anlise,
possibilitando a elaborao de relatrios, quer pelo prprio programa, quer por uma
articulao com um processador de texto (LAUREANO e BOTELHO, 2010).
71
Modelos de Regresso: uma aplicao em Medicina Dentria
Figura 24: Grficos circulares comparativo dos Hbitos Tabgicos por sexo
72
Modelos de Regresso: uma aplicao em Medicina Dentria
Figura 25: Distribuio do Nvel de Aderncia em fumadores por sexo e status diabtico
Figura 26: Diagrama de extremos das variveis Escolaridade e Idade em funo do Status Diabtico
73
Modelos de Regresso: uma aplicao em Medicina Dentria
74
Modelos de Regresso: uma aplicao em Medicina Dentria
Pela observao do diagrama de disperso podemos inferir que a correlao linear entre
HDL e Nvel de Aderncia negativa e que entre Nvel de Aderncia e Colesterol Total
positiva.
75
Modelos de Regresso: uma aplicao em Medicina Dentria
3. Testes no paramtricos
A escolaridade mdia dos no diabticos (8,89) foi superior dos diabticos (6,71). Quando
comparados os dois grupos usando o teste de Mann-Whitney observamos uma diferena
estatisticamente significativa (p=0,0026). Podemos portanto concluir que existe diferena na
escolaridade entre os diabticos e no diabticos.
76
Modelos de Regresso: uma aplicao em Medicina Dentria
A comparao dos dados antropomtricos revelou que o grupo dos diabticos tinha valores
mdios superiores nas variveis observadas, sendo significativas apenas as diferenas do
permetro mdio da cinta (C) (p=0,0329) e do IMC mdio (p=0,0063) (Tabela 7).
77
Modelos de Regresso: uma aplicao em Medicina Dentria
Como podemos observar, o maior Nvel de Aderncia verificado na figura no canto inferior
direito, correspondente a Fumadores masculinos com diabetes tipo 2. Podemos ainda
78
Modelos de Regresso: uma aplicao em Medicina Dentria
As variveis Nvel de Aderncia e Recesso Gengival foram comparados pelo teste de Mann-
Whitney, uma vez que este teste no exige o pressuposto da normalidade, podendo ser
aplicado para amostras pequenas, e em variveis de escala ordinal. Tendo-se testado as
hipteses:
79
Modelos de Regresso: uma aplicao em Medicina Dentria
Apenas nos no diabticos as variveis Colesterol Total (r=0,33; p=0,004), LDL (r=0,41;
p=0,0002) e ndice de Massa Corporal (r=0,34; p=0,002) apresentam diferenas entre os
coeficientes de correlao significativas para LDL (z=2,04) e no significativas as restantes
variveis.
de referir que para a varivel HDL o valor do coeficiente de correlao sempre negativo,
pelo que podemos afirmar que um agravamento dos indicadores de sade periodontal esto
associados a uma diminuio de HDL. Tal associao estatisticamente significativa em
geral para o grupo dos no diabticos, enquanto que para os diabticos s estatisticamente
significativa quanto ao Nvel de Aderncia e Receo Gengival.
80
Modelos de Regresso: uma aplicao em Medicina Dentria
Objetivos:
3. Criar uma tabela de ANOVA e com recurso ao teste F testar a hiptese nula =0.
Rotinas:
81
Modelos de Regresso: uma aplicao em Medicina Dentria
82
Modelos de Regresso: uma aplicao em Medicina Dentria
O objetivo da anlise de regresso mltipla determinar a fora de cada uma das Variveis
Independentes que, em conjunto, melhor explicam o comportamento da Varivel
Dependente. No nosso estudo pretendemos prever mudanas da varivel Nvel de Aderncia
associadas a mudanas das variveis independentes (Idade, Sexo, Escolaridade, Status
Diabtico, Fumador e ndice de Placa).
As variveis com correlaes mais fortes sero aquelas que conduziro a um modelo que
melhor ir predizer a Varivel Dependente. Porm, como o nosso estudo foi feito no mbito
da Medicina Dentria, a escolha das Variveis Independentes a incluir tem relevncia na
interpretao biolgica do fenmeno. No se trata da escolha cega de variveis mas sim da
seleo de variveis nas condies anteriormente indicadas que tenham significado no
contexto do problema.
Y 0 1 X 1i 2 X 2i 3 . X 3i 4 X 4i 5 X 5i 6 X 6i
83
Modelos de Regresso: uma aplicao em Medicina Dentria
Neste modelo encontramos =0,384, donde podemos afirmar que 38,4% da variabilidade
do Nvel de Aderncia explicada pelas variveis independentes do modelo ajustado. O valor
do coeficiente de correlao r=0,619. Ou seja, 61,9% da variabilidade encontrada para o
Nvel de Aderncia pode ser explicada pelas variveis independentes, ficando neste caso por
explicar cerca de 39%, que se devem a outros fatores. No podemos considerar que este
modelo seja um bom ajuste pois o valor de r 2 no se encontra prximo de 1. No existe pois
uma forte relao entre as variveis.
Tabela 12 : ANOVA (Variveis preditoras: Constante), IP, Sexo, Diab., Idade, Escol, Fumador
Modelo Soma dos Quadrados Graus de liberdade Quadrado Mdio F Sinal
Regresso 5196,977 6 866,163 15,644 0,000
Residual 8349,543 151 55,295
Total 13546,520 157
84
Modelos de Regresso: uma aplicao em Medicina Dentria
A coluna t d-nos os valores observados das estatsticas dos testes de t de Student aplicados
aos coeficientes de regresso, que tm como finalidade testar a significncia dos parmetros
estimados do modelo. Com um nvel de confiana de 95%, apenas a varivel Status
Diabtico significante, sendo aquela que tem maior contribuio individual (4,604).
A validao dos pressupostos do modelo assenta na anlise de resduos. Com esse objetivo
desenhmos o diagrama de disperso. Da sua observao razovel afirmar que existe uma
relao linear entre as variveis, uma vez que os resduos se distribuem de forma mais ou
menos aleatria em torno do zero, sugerindo a validade do pressuposto de independncia e
da homocedasticidade. Porm, no nos d qualquer informao sobre o pressuposto da
normalidade dos resduos.
85
Modelos de Regresso: uma aplicao em Medicina Dentria
Figura 32: Grficos dos Resduos versus preditos; resduos padronizados e da probabilidade normal
dos resduos
O p-value (exato) 0,418, logo no rejeitamos a hiptese de que a varivel em estudo segue
uma distribuio normal para o nvel de significncia de = 0,05.
86
Modelos de Regresso: uma aplicao em Medicina Dentria
Usando a varivel RES (os resduos guardados) e fazendo um QQ plot (figura 33) e os
testes de ajustamento de Kolmogorov-Smirnov e de Shapiro-Wilk podemos concluir que os
resduos tm uma distribuio normal (o QQ plot identifica um ajuste entre os quantis
amostrais e os quantis de distribuio normal) e os testes de ajustamentos fornecem os p-
values superiores aos nveis de significncia usual (0,062 > 0,05).
87
Modelos de Regresso: uma aplicao em Medicina Dentria
A partir da tabela 17 tambm podemos verificar quais as variveis que so significantes para
o modelo, ou seja, aquelas cujo coeficiente apresenta um valor significativamente diferente
de zero.
88
Modelos de Regresso: uma aplicao em Medicina Dentria
Pela leitura da tabela 19, podemos concluir que o teste de significncia da equao de
Regresso Linear Mltipla indicou que todos os modelos construdos podem ser
considerados significativos para um nvel de significncia de 5%, uma vez que o F calculado
maior que o F crtico. Assim, rejeitamos a hiptese H0, o que quer dizer que as varincias
so iguais e consequentemente os modelos de regresso so vlidos. Como os p-value so
89
Modelos de Regresso: uma aplicao em Medicina Dentria
todos inferiores a 0,05, podemos assegurar que qualquer um dos quatro modelos de
regresso (descritos a seguir) so melhores que a mdia para predizer os valores do Nvel de
Aderncia.
90
Modelos de Regresso: uma aplicao em Medicina Dentria
Yi 0 1 X 1i 2 X 2i
No Modelo 1:
Escolaridade
No Modelo 2:
No Modelo 3:
No Modelo 4:
91
Modelos de Regresso: uma aplicao em Medicina Dentria
Estatsticas de colinearidade
Modelo Beta in t Sinal Parcial
Tolerncia
Tolerncia VIF
mnima
a
Diabtico 0,304 4,319 0,000 0,328 0,902 1,109 0,902
a
Sexo 0,011 0,161 0,872 0,013 1,000 1,000 1,000
a
1 Idade 0,240 2,988 0,003 0,233 0,735 1,360 0,735
a
Fumador 0,045 0,637 0,525 0,051 1,000 1,000 1,000
a
IP 0,175 2,327 0,021 0,184 0,851 1,175 0,851
b
Sexo 0,012 0,173 0,863 0,014 1,000 1,000 0,902
b
Idade 0,244 3,217 0,002 0,251 0,735 1,360 0,679
2 b
Fumador 0,072 1,067 0,288 0,086 0,992 1,008 0,895
b
IP 0,162 2,260 0,025 0,179 0,850 1,177 0,786
c
Sexo 0,004 0,068 0,946 0,006 0,999 1,001 0,678
c
3 Fumador 0,127 1,909 0,058 0,153 0,939 1,065 0,663
c
IP 0,155 2,232 ,027 0,178 0,849 1,178 0,617
d
Sexo -0,001 -0,018 ,986 -0,001 0,997 1,003 0,616
4 d
Fumador 0,113 1,718 0,088 0,138 0,930 1,076 0,608
a. Predictors in the Model: (Constant),
b. Predictors in the Model: (Constant), Escolaridade, Diabtico
Escolaridade
c. Predictors in the Model: (Constant), d. Predictors in the Model: (Constant), Escolaridade, Diabtico, Idade,
Escolaridade, Diabtico, Idade IP
92
Modelos de Regresso: uma aplicao em Medicina Dentria
93
Modelos de Regresso: uma aplicao em Medicina Dentria
VI: Na
Rotinas:
modelo=lm(Na~diabetes+Idade+Sexo+Escol+Fumador+Ip)
#imprimir
modelo
Resultados:
onde Yi o valor do Nvel de Aderncia e X 1i o valor do Status Diabtico, X3i o sexo, X2i a
Idade, X4i e o valor da Escolaridade, X5i ser Fumador e X6i o ndice de Placa.
94
Modelos de Regresso: uma aplicao em Medicina Dentria
6. Regresso logstica
O valor de corte (4 mm) para a varivel dependente (Nvel de Aderncia) foi feito com recurso
metodologia adotada em Medicina Dentria (PEREIRA, J. (2007)), que consiste num grfico
de percentagem acumulada do Nvel de Aderncia em que o ponto de inflexo das curvas
relativas aos diabticos e no diabticos vai corresponder ao valor de corte, neste caso ser
de aproximadamente 4 mm, conforme figura 34.
Profundidade de sondagem
NA(mm)
Diabticos
Controlos
3 5 7 9 11 13 15 17
Em anlise estatstica, o valor 4 mm seria determinado com recurso curva ROC, que
representa a sensibilidade em funo da proporo de falsos positivos (1 Especificidade)
para um conjunto de valores de "cutoff point". Por outro lado, as curvas ROC permitem
quantificar a exatido de um teste diagnstico, j que esta proporcional rea sob a curva
ROC, isto , tanto maior quanto mais a curva se aproxima do canto superior esquerdo do
diagrama. Sabendo isto, a curva ser til, tambm, na comparao de testes diagnsticos,
tendo o teste uma exatido tanto maior quanto maior for a rea sob a curva ROC.
95
Modelos de Regresso: uma aplicao em Medicina Dentria
A rea sob a curva ROC uma medida do desempenho de um teste (ndice de exatido do
teste). Um teste totalmente incapaz de discriminar indivduos doentes e no doentes teria
uma rea sob a curva de 0,5 (seria a hiptese nula). Acima de 0,70 considerado
desempenho satisfatrio. Por observao da tabela 25 podemos concluir que no nosso
exemplo a rea de 0,755 (IC a 95% de 0,681 a 0,829), logo a significncia inferior a 0,05,
o que significa que a utilizao do ensaio melhor do que a probabilidade do acaso.
96
Modelos de Regresso: uma aplicao em Medicina Dentria
a. The smallest cutoff value is the minimum observed test value minus 1, and the largest cutoff value is the maximum
observed test value plus 1. All the other cutoff values are the averages of two consecutive ordered observed test values.
97
Modelos de Regresso: uma aplicao em Medicina Dentria
Usando este ponto de corte vamos ter uma sensibilidade de 0,913 e 1 especificidade de
0,561. Assim, aproximadamente 91,3% de todas as amostras do NA > 4 seriam corretamente
identificadas como tal, e 56,1% de todas as amostras do NA 4 poderiam ser incorretamente
identificadas como positivas.
A rea sob a curva (figura 35) mostrou que a utilizao do teste melhor do que a
probabilidade de ocorrncia, mas, alm disto, as coordenadas da curva (destacadas na
tabela 26) so teis porque fornecem algumas orientaes para determinar qual o melhor
ponto de corte para a determinao os resultados do teste positivo e negativo.
98
Modelos de Regresso: uma aplicao em Medicina Dentria
Cdigo do Parmetro
Frequncia
(1) (2)
Diabtico No diabtico 79 1 0
Diabtico tipo 1 20 0 1
Diabtico tipo2 59 0 0
Fumador No 125 1
Sim 33 0
Sexo Feminino 82 1
Masculino 76 0
99
Modelos de Regresso: uma aplicao em Medicina Dentria
A seleo de Forward baseada no teste de Wald comea por considerar um modelo apenas
com a constante (tabela 29).
A tabela 30, apresenta as estatsticas Score das variveis no includas no modelo e os seus
p-value. Para , as variveis escolaridade e diabetes so estatisticamente
significativas.
100
Modelos de Regresso: uma aplicao em Medicina Dentria
Tambm importante detetarmos pontos influentes, ou seja, pontos que afetam de forma
significativa o ajuste do modelo.
101
Modelos de Regresso: uma aplicao em Medicina Dentria
102
Modelos de Regresso: uma aplicao em Medicina Dentria
Predito
Observado Nvel de aderncia >4
Percentagem
< 50% 50%
< 50% 140 0 100,0
Nvel de aderncia >4
Step 1 50% 18 0 0,0
Overall Percentage 88,6
a. O valor de corte 0,500
De acordo com os dados da tabela 36, apenas 18 indivduos positivos para a condio esto
classificados como negativos (falso-negativos); os restantes encontram-se bem classificados.
Podemos assim concluir que a sensibilidade do modelo de 100% (ou seja, classifica
corretamente os doentes) e a especificidade 0% (que a probabilidade condicionada de
prever um diagnstico negativo sabendo que o indivduo no tem doena). Globalmente o
modelo classifica corretamente 88,6% dos indivduos que apresentam NA <4.
O estimador do logit e seu intervalo de confiana fornece o estimador dos valores ajustados.
O intervalo de confiana dos valores ajustados apresentado na tabela 37.
103
Modelos de Regresso: uma aplicao em Medicina Dentria
A anlise dos resduos permite identificar outliers e casos influentes na estimao do modelo
e as medidas usadas so basicamente as mesmas da regresso linear, apenas necessrio
entrar em considerao com as varincias das observaes, pois na regresso logstica elas
no so constantes.
Do grfico representado na figura 36 podemos afirmar que este modelo apresenta outliers.
Predicted Probability is of Membership for Igual ou Superior a 50%. The Cut Value is .50. Symbols: 0 - Inferior a 50%; 1 - Igual ou
Superior a 50%; Each Symbol Represents 5 Cases.
104
Modelos de Regresso: uma aplicao em Medicina Dentria
Pela leitura da tabela 38 conclumos que as observaes 48, 59, 63, 72, 109 e 126
apresentam valores elevados de resduos estandardizados (ZRESID), indicando que estes
casos foram mal classificados no modelo (ou seja encontram-se mal classificados pelo
modelo 3,8% seis casos em 158 das observaes).
De forma anloga vamos analisar o modelo gerado pelo mtodo ENTER, cujas tabelas do
SPSS se encontram no anexo III.
Mtodo Enter
Como 2LL um indicador da qualidade do ajustamento do modelo aos dados, e o seu valor
muito elevado (102,408), podemos afirmar que o ajustamento no bom.
O teste de ajustamento de Hosmer and Lemeshow permite concluir que os valores estimados
pelo modelo esto prximos dos valores esperados, ou seja, o modelo ajusta-se aos dados
uma vez que o p-value 0,826.
105
Modelos de Regresso: uma aplicao em Medicina Dentria
12
10
8
6
Limite inferior
4
Limite Superior
2
odds ratio
0
Onde X3i a Idade, X2i o Sexo, X1i o valor do Status Diabtico, X4i o valor da
Escolaridade, X5i ser Fumador e X6i o ndice de Placa.
Analisando os outliers, conclumos que para alm das observaes 48, 59, 63, 72, 109 e 126
que se encontravam referenciadas no modelo anterior, ainda surgem mais duas (45 e 149)
que apresentam valores elevados de resduos estandardizados (ZRESID), indicando que
estes casos foram mal classificados no modelo.
106
Modelos de Regresso: uma aplicao em Medicina Dentria
Algumas avaliaes devem ser realizadas para se ter alguma ideia da eficcia e adequao
do modelo.
107
Modelos de Regresso: uma aplicao em Medicina Dentria
Quando recorremos seleo de variveis pelo mtodo Enter (sadas do SPSS no anexo II),
de acordo com os resultados apresentados, podemos concluir que o modelo ajustado no se
apresentou satisfatrio, logo com um fraco poder preditivo. Neste modelo foram includas
todas as variveis independentes, a estatstica de Wald mostra que nenhuma varivel
significativa para o modelo quando pretendemos prever o valor do NA. Um bom ajuste de
modelo indicado por um valor Qui-quadrado no-significante. Na tabela (Hosmer and
Lemeshow Test anexo II), o alto valor de significncia (p-value) de 0,826, considerada a
distribuio Qui-quadrado com 8 graus de liberdade, sugere que falha em se rejeitar a
hiptese nula de que no h diferena entre os valores reais e os previstos. Em resumo, o
modelo estima o ajuste dos dados num nvel aceitvel.
Em sntese:
Grau de relao Anlise Multivariada Com recurso correlao foi comparada a situao
entre as variveis periodontal entre os doentes diabticos e no diabticos,
emparelhados para o sexo e idade, os diabticos
evidenciam pior sade periodontal.
Anlise Multivariada O NA dos no diabticos e dos diabticos esto
diretamente correlacionados com Idade, HDL,
Triglicerdeos e ndice de Placa.
Com base na Anlise Multivariada podemos dizer que as
variveis que melhor permitem prever o valor do Nvel de
Aderncia so a Idade, o HDL, Triglicerdeos e ndice de
Placa.
Regresso logstica
108
Modelos de Regresso: uma aplicao em Medicina Dentria
Convm referir que, de uma maneira geral, a anlise de regresso pode ser utilizada com
vrios objetivos dentre os quais destacamos a Descrio, a Predio, o Controlo e a
Estimao. Na prtica, a anlise de Regresso utilizada para atingir simultaneamente mais
do que um dos objetivos citados.
109
Modelos de Regresso: uma aplicao em Medicina Dentria
REFERNCIAS BIBLIOGRFICAS
ABREU M. N. S., SIQUEIRA A. L., CAIAFFAI W.T. (2009): Regresso logstica ordinal em estudos
epidemiolgicos, Rev Sade Pblica;43(1): 183-94.
BETZ, N.E. (1987): Use of Discriminant Analyses in Counseling Psychology Research. Journal of
Counseling Psychology, 34 (4),393-403.
BRAGA, A. (2000): Curva ROC: Aspectos fundamentais e Avaliao. Braga: Tese de Doutoramento,
Universidade do Minho.
CHALONER K., LARNTZ K. (1989): Optimal Bayesian Design Applied to Logistic Regression
Experiments, Journal of Statistical Planning and Inference 21 191-208
CLEVELAND, WILLIAM S.; MCGILL, ROBERT (1987): Graphical perception: The visual decoding of
quantitative information on graphical displays of data, Journal of the Royal Statistical Society, 150,192-
229.
COELHO-BARROS, E. A., SIMES P. A., ACHCAR J. A., MARTINEZ E. Z., SHIMANO A. C., (2008):
Mtodos de estimao em regresso linear mltipla: aplicao a dados clnicos, Revista Colombiana
de Estadstica, volume 31, n 1: 111- 129
LAUREANO, M.; BOTELHO, M. (2010): SPSS o meu manual de consulta rpida. (1 Edio) Edies
Slabo, Lda. Lisboa.
LAMSTER I., LALLA E., BORGNAKKE V., TAYLOR W. (2008): The Relationship Between Oral
Health and Diabetes Mellitus, JADA October 2008 vol. 139 no. supl 519S-24S
HOFFMAN, H. (2006): Visualizing Simple Logistic Regression Models using Mosaic Plots.
HOSMER, D. J., & LEMESHOW, S. (1989): Applied Logistic Regression. Copyright by John Wiley &
Sons, Inc.
nd
HOSMER D W, LEMESHOW S. (2000): Applied Logistic Regression, 2 ed. New York; Wiley.
MADSEN L., FANG Y., Joint Regression Analysis for Discrete Longitudinal Data, Biometrics.
MARGOTTO, P. (s.d.): Curva ROC: Como fazer e Interpretar no SPSS. Curso de Medicina da Escola
Superior de Cincias da Sade (ESCS/CES/DF).
MAROCO, J. (2007): Anlise Estatstica com utilizao do SPSS. 3 Ed., Edies Slabo.
110
Modelos de Regresso: uma aplicao em Medicina Dentria
MILTON J. S.; TSOKOS J.O. (1983): Statistical Methods in the Biological and Health Sciences.
McGraw-Hill Book Company.
MONTGOMERY. D. C.: (2001): Design and Analysis of Experiments, 5th Ed, John Wiley & Sons.
PRESHAW P. M., ALBA A. L., HERRERA D., JEPSEN S., KONSTANTINIDIS A., MAKRILAKIS K.,
TAYLOR R. (2012). Periodontitis and diabetes: a two-way relationship. Diabetologia. 2012
January; 55(1): 2131.
RUSH SLOAN (2001): Logistic Regression: The Standard Method of Analysis, in Medical Research
SCOT, M. (2002): Applied Logistic Regression Analysis, 2nd Edition, Sage Publications.
SGOLASTRA F, SEVERINO M., PIETROPAOLI D., GATTO R., MONACO A. (2012): Effectiveness of
Periodontal Treatment to Improve Metabolic Control in Patients With Chronic Periodontitis and Type 2
Diabetes: A Meta-Analysis of Randomized Clinical Trials. Journal of Periodontology, October 29
STEVEN C. B., HALBERT W., BEATRICE A. GOLOMBC (2001) Logistic regression in the medical
literature: Standards for use and reporting, with particular attention to one medical domain, Journal of
Clinical Epidemiology 54 979985.
TABACHNICK B., FIDELL L. (2007), Using Multivariate Statistics (5 Edio).NY: Pearson Allyn &
Baccon.
TURKMAN M. A., SILVA G. L. (2000), Modelos Lineares Generalizados - da teoria prtica Lisboa.
111
Modelos de Regresso: uma aplicao em Medicina Dentria
ANEXOS
112
Modelos de Regresso: uma aplicao em Medicina Dentria
Anexo I
113
Modelos de Regresso: uma aplicao em Medicina Dentria
PS NA Rm HPSm
r 0,394 0,442 0,572 0,361
No Diabticos p <0,0001 <0,0001 <0,0001 0,001
cd 0,15 0,20 0,33 0,13
I r 0,278 0,514 0,607 0,087
Diabticos p 0,013 <0,0001 <0,0001 0,447
cd 0,08 0,26 0,37 0,01
z dif. de r 0,81 0,57 0,33 1,79
r 0,083 0,176 0,114 0,126
No Diabticos p 0,466 0,121 0,319 0,270
cd 0,01 0,03 0,01 0,02
GPJ r -0,057 -0,029 -0,029 0,049
Diabticos p 0,616 0,983 0,797 0,666
cd 0,00 0,00 0,00 0,00
z dif. de r 0,87 1,28 0,88 0,47
r 0,388 0,325 0,258 0,401
No Diabticos p 0,000 0,004 0,022 0,000
cd 0,15 0,11 0,07 0,16
CT r 0,033 0,187 0,121 0,142
Diabticos p 0,776 0,0992 0,290 0,212
cd 0,00 0,03 0,01 0,02
z dif. de r 2,32 0,91 0,88 1,74
r -0,394 -0,451 -0,341 -0,371
No Diabticos p 0,000 <0,0001 0,002 0,001
cd 0,16 0,20 0,12 0,14
HDL r -0,149 -0,282 -0,269 -0,034
Diabticos p 0,189 0,0119 0,017 0,767
cd 0,02 0,08 0,07 0,00
z dif. de r 1,638 1,212 0,490 2,195
r 0,453 0,408 0,265 0,490
No Diabticos p <0,0001 0,000 0,018 <0,0001
cd 0,20 0,17 0,07 0,24
LDL r 0,017 0,102 0,113 0,127
Diabticos p 0,882 0,3712 0,323 0,264
cd 0,00 0,01 0,01 0,02
z dif. de r 2,90 2,04 0,98 2,52
r 0,262 0,255 0,339 0,171
No Diabticos p 0,020 0,023 0,002 0,133
cd 0,07 0,07 0,11 0,03
T r 0,267 0,280 0,207 0,218
Diabticos p 0,0174 0,0124 0,0 74 0,0533
cd 0,07 0,08 0,04 0,05
z dif. de r 0,03 0,17 0,88 0,31
r 0,353 0,342 0,400 0,419
No Diabticos p 0,001 0,002 0,000 0,000
cd 0,12 0,12 0,16 0,18
IMC r 0,098 0,215 0,214 0,181
Diabticos p 0,391 0,0 0,059 0,110
cd 0,01 0,05 0,05 0,00
z dif. de r 1,67 0,84 1,28 1,62
r 0,566 0,512 0,335 0,601
No Diabticos p <0,0001 <0,0001 0,003 <0,0001
cd 0,32 0,26 0,11 0,36
IP r 0,447 0,298 0,131 0,546
Diabticos p <0,0001 0,010 0,248 <0,0001
cd 0,20 0,09 0,02 0,30
z dif. de r 0,99 1,59 1,33 0,50
Spearman -
114
Modelos de Regresso: uma aplicao em Medicina Dentria
Anexo II
115
Modelos de Regresso: uma aplicao em Medicina Dentria
/CONTRAST (Sexo)=Indicator
/CONTRAST (Fumador)=Indicator
/CONTRAST (Diabetes)=Indicator
116
Modelos de Regresso: uma aplicao em Medicina Dentria
Model Summary
Step Cox & Snell R Nagelkerke R
-2 Log likelihood Square Square
a
1 97,899 ,086 ,169
2 97,922a ,086 ,169
a
3 98,336 ,083 ,164
a
4 98,857 ,080 ,158
b
5 104,808 ,045 ,088
c
6 106,917 ,032 ,063
a. Estimation terminated at iteration number 20 because maximum
iterations has been reached. Final solution cannot be found.
b. Estimation terminated at iteration number 6 because parameter
estimates changed by less than ,001.
c. Estimation terminated at iteration number 5 because parameter
estimates changed by less than ,001.
Classification Tablea
Observed Predicted
Nvel de aderncia >4
Igual ou Percentage
Inferior a 50% Superior a 50% Correct
Step 1 Nvel de aderncia >4 Inferior a 50% 140 0 100,0
Igual ou Superior a 50% 18 0 ,0
Overall Percentage 88,6
Step 2 Nvel de aderncia >4 Inferior a 50% 140 0 100,0
Igual ou Superior a 50% 18 0 ,0
Overall Percentage 88,6
Step 3 Nvel de aderncia >4 Inferior a 50% 140 0 100,0
Igual ou Superior a 50% 18 0 ,0
Overall Percentage 88,6
Step 4 Nvel de aderncia >4 Inferior a 50% 140 0 100,0
Igual ou Superior a 50% 18 0 ,0
Overall Percentage 88,6
Step 5 Nvel de aderncia >4 Inferior a 50% 140 0 100,0
Igual ou Superior a 50% 18 0 ,0
Overall Percentage 88,6
Step 6 Nvel de aderncia >4 Inferior a 50% 140 0 100,0
Igual ou Superior a 50% 18 0 ,0
Overall Percentage 88,6
a. The cut value is ,500
117
Modelos de Regresso: uma aplicao em Medicina Dentria
118
Modelos de Regresso: uma aplicao em Medicina Dentria
119
Modelos de Regresso: uma aplicao em Medicina Dentria
/CLASSPLOT
/CASEWISE OUTLIER(2)
Model Summary
1 4,331 8 ,826
120
Modelos de Regresso: uma aplicao em Medicina Dentria
Classification Tablea
Observed Predicted
Nvel de aderncia >4
Igual ou Superior Percentage
Inferior a 50% a 50% Correct
Step 1 Nvel de aderncia >4 Inferior a 50% 140 0 100,0
Igual ou Superior a 50% 18 0 ,0
Overall Percentage 88,6
a. The cut value is ,500
121
Modelos de Regresso: uma aplicao em Medicina Dentria
Correlation Matrix
Fumado
Constant Idade_classe Sexo Diabetes Escol_classes r IP_classe
Step 1 Constant 1,000 -,139 -,173 -,611 -,369 -,288 -,574
Idade_classe -,139 1,000 ,119 -,046 -,380 -,265 ,000
Sexo -,173 ,119 1,00 -,074 -,111 -,314 -,122
0
Diabetes -,611 -,046 -,074 1,000 ,248 ,189 ,068
Escol_classes -,369 -,380 -,111 ,248 1,000 ,066 ,205
Fumador -,288 -,265 -,314 ,189 ,066 1,000 ,181
IP_classe -,574 ,000 -,122 ,068 ,205 ,181 1,000
122
Modelos de Regresso: uma aplicao em Medicina Dentria
Casewise Listb
Case Observed Temporary Variable
Selected Predicted
Statusa Nvel de aderncia >4 Predicted Group Resid ZResid
45 S 1** ,107 0 ,893 2,882
48 S 1** ,080 0 ,920 3,392
59 S 1** ,031 0 ,969 5,616
63 S 1** ,131 0 ,869 2,573
dimension0 72 S 1** ,103 0 ,897 2,959
93 S 1** ,125 0 ,875 2,647
109 S 1** ,104 0 ,896 2,928
126 S 1** ,044 0 ,956 4,657
149 S 1** ,089 0 ,911 3,195
a. S = Selected, U = Unselected cases, and ** = Misclassified cases.
b. Cases with studentized residuals greater than 2,000 are listed.
123
Modelos de Regresso: uma aplicao em Medicina Dentria
Anexo III
124
Modelos de Regresso: uma aplicao em Medicina Dentria
Anlise Descritiva
Objetivos:
1. Construir grficos.
C. Construir um histograma
1. Construir grficos
Rotinas:
125
Modelos de Regresso: uma aplicao em Medicina Dentria
Resultados:
126
Modelos de Regresso: uma aplicao em Medicina Dentria
127