Professional Documents
Culture Documents
PÁGINA 3
Como é estimada a taxa de desenvolvimento de uma nova doença?
Para estimar a taxa de desenvolvimento de uma nova doença, por exemplo, a doença
cardiovascular, precisamos de uma estratégia de amostragem específica. Para esta análise,
usaríamos uma amostra apenas de pessoas sem doença cardiovascular e as acompanharíamos
ao longo do tempo (prospectivamente) para avaliar o desenvolvimento da doença. Uma questão
principal nesses tipos de estudos é o período de acompanhamento. O pesquisador deve decidir
se irá acompanhar os participantes por 1, 5 ou 10 anos, ou por algum outro período, para
observar o desenvolvimento ou não da doença. Se for interessante estimar o desenvolvimento
da doença ao longo de 10 anos, será preciso acompanhar cada participante da amostra por 10
anos para determinar o status da doença de cada um. A proporção do número de novos casos
da doença em relação ao tamanho total da amostra reflete a proporção ou a incidência cumulativa
de novos casos da doença ao longo do período de acompanhamento predeterminado. Suponha
que acompanhamos cada um dos participantes da nossa amostra por 5 anos e descobrimos que
2,4% desenvolveram a doença. Novamente, de modo geral, é interessante fornecer uma faixa
de valores plausível para a proporção de novos casos da doença. Isso é conseguido
incorporando uma margem de erro que reflita a precisão da nossa estimativa. A incorporação da
margem de erro pode resultar em uma estimativa da incidência cumulativa da doença entre 1,2
e 3,6% ao longo de 5 anos.
Suponha que criamos a hipótese de que um determinado fator de risco ou exposição específicos
estejam relacionados ao desenvolvimento de uma doença. Há diversos projetos ou formas de
estudo diferentes em que podemos coletar informações para avaliar o relacionamento entre um
possível fator de risco e as primeiras manifestações de uma doença. O projeto de estudo mais
apropriado depende, entre outras coisas, da distribuição do fator de risco e do resultado na
população de interesse (por exemplo, quantos participantes estão suscetíveis a ter, ou não, um
determinado fator de risco). (Discutimos diferentes projetos de estudo no Capítulo 2 e qual projeto
é o melhor em uma situação específica.) Independente do projeto específico utilizado, o fator de
risco e o resultado devem ser medidos em cada membro da amostra. Se estivermos interessados
na relação entre o fator de risco e o desenvolvimento da doença, mais uma vez envolveríamos
participantes sem a doença no começo do estudo e acompanharíamos todos os participantes
em relação ao desenvolvimento da doença. Para avaliar se há uma relação entre um fator de
risco e o resultado, estimamos a proporção (ou percentual) de participantes com o fator de risco
que desenvolvem a doença e comparamos com a proporção (ou percentual) de participantes que
não têm o fator de risco e desenvolvem a doença. Existem várias maneiras de fazer essa
comparação; ela pode ser baseada em uma diferença em proporções ou em uma razão de
proporções. (Os detalhes dessas comparações são amplamente discutidos no Capítulo 6 e no
Capítulo 7.)
Suponha que entre os participantes com o fator de risco, 12% desenvolvam a doença durante o
período de acompanhamento e entre aqueles sem o fator de risco, 6% desenvolvam doença. A
razão das proporções é chamada de risco relativo e aqui é igual á 0,12 / 0,06 = 2,0. A
interpretação é que duas vezes mais pessoas com o fator de risco desenvolvem a doença em
comparação a pessoas sem o fator de risco. O problema, então, é determinar se essa estimativa,
observada em uma amostra de estudo, reflete um risco aumentado na população. Representar
a incerteza pode resultar em uma estimativa do risco relativo de 1,1 a 3,2 vezes maior para
pessoas com o fator de risco. Como a faixa contém valores de risco superiores a 1, os dados
refletem um risco maior (porque o valor de 1 sugere que não há aumento de risco).
Outro problema em avaliar a relação entre um fator de risco específico e o status da doença
envolve entender relações complexas entre fatores de risco. Pessoas com o fator de risco podem
ser diferentes de pessoas sem o fator de risco; por exemplo, podem ser mais velhas e mais
propensas a ter outros fatores de risco. Existem métodos que podem ser usados para avaliar a
associação entre o fator de risco hipotético e o status da doença, levando em consideração o
impacto dos outros fatores de risco. Essas técnicas envolvem modelagem estatística. Discutimos
como esses modelos são desenvolvidos e, mais importante, como os resultados são
interpretados, no Capítulo 9.
CAPÍTULO 4: Resumo dos dados coletados na amostra
PÁGINAS 41-44
Exemplo 4.2. Usando os dados do sétimo exame do Framingham Offspring Study (n = 3539),
criamos as categorias que foram definidas previamente para pressão sanguínea, colesterol total
e IMC. Tabelas de distribuição de frequência, similares às apresentadas para os dados
dicotômicos, também são usadas para resumir as variáveis categóricas ordinais. A Tabela 4–5 é
uma tabela de distribuição de frequência da variável ordinal de pressão sanguínea. As categorias
mutuamente exclusivas (sem sobreposição) e exaustivas (que cobrem todas as possibilidades)
são apresentadas na primeira coluna da tabela. A frequência, ou o número de participantes em
cada categoria, é apresentada na coluna do meio, e a frequência relativa, em porcentagem, está
na coluna à direita.
Apesar do tamanho da amostra ser de n=3539, note que há apenas n=3533 respostas válidas.
Não há dados sobre pressão sanguínea de seis indivíduos. Mais de um terço da amostra (34,1%)
tem pressão normal, 41.1% são classificados como pré-hipertensão, 18,5% têm hipertensão
estágio 1 e 6,3% tem hipertensão estágio 2. Para variáveis ordinais, muitas vezes duas colunas
são adicionadas à tabela de distribuição de frequência: frequência acumulada e frequência
relativa acumulada, respectivamente (Veja a Tabela 4–6).
Nesse exemplo, a frequência acumulada representa o número de pacientes que estão no nível
de pressão sanguínea ou abaixo dele. Por exemplo, 2.658 pacientes apresentam pressão normal
ou pré-hipertensão. Há 3.311 pacientes com pressão normal, pré-hipertensão ou hipertensão
estágio 1. A frequência relativa acumulada é útil para resumir as variáveis ordinais e indicar o
percentual de pacientes em um nível específico ou abaixo dele. Nesse exemplo, 75,2% dos
pacientes não foram classificados como hipertensos (ou seja, eles apresentam pressão normal
ou pré-hipertensão). Note que para a última categoria de pressão sanguínea (a mais alta), a
frequência acumulada equivale ao tamanho da amostra (n=3533) e a frequência relativa
acumulada é de 100%, indicando que todos os pacientes estão no nível mais alto ou abaixo dele.
Frequência
Frequência relativa (%)
Normal 1206 34,1
Pré-hipertensão 1452 41,1
Hipertensão estágio 1 653 18,5
Hipertensão estágio 2 222 6,3
Total 3533 100,0
TABELA 4-6 Tabela de distribuição de frequência para categorias de pressão sanguínea com
frequência acumulada e frequência relativa acumulada
Frequência relativa
Frequência Frequência relativa (%) Frequência acumulada acumulada (%)
Normal 1206 34,1 1206 34,1
Pré-hipertensão 1452 41,1 2658 75,2
Hipertensão estágio 1 653 18,5 3311 93,7
Hipertensão estágio 2 222 6,3 3533 100,0
Total 3533 100,0
A Tabela 4-7 mostra a tabela de distribuição de frequência para o colesterol total. As categorias
de colesterol total são descritas a seguir e, novamente, são baseadas nos valores de colesterol
mensurados. Pessoas com colesterol total abaixo de 200 mg/dl são classificadas como tendo
colesterol total desejável; 200-239 mg/dl, são classificadas como limítrofe; e 240 mg/dl ou acima,
são classificadas como tendo colesterol total alto. No sétimo exame do Framingham Offspring
Study, 51,6% dos pacientes tinham colesterol total desejável e outros 34,3% tinham colesterol
total limítrofe. Usando a frequência relativa acumulada, podemos resumir os dados da seguinte
forma: 85,9% dos pacientes apresentam níveis de colesterol total desejável ou limítrofe. Os
14,1% restantes possuem colesterol total alto.
TABELA 4-7 Tabela de distribuição de frequência para categorias de colesterol total
Frequência relativa
Frequência Frequência relativa (%) Frequência acumulada acumulada (%)
Desejável 1712 51,6 1712 51,6
Limítrofe 1139 34,3 2851 85,9
Alto 469 14,1 3320 100,0
Total 3320 100,0
A Tabela 4–8 mostra a tabela de distribuição de frequência para a variável ordinal IMC. Tanto a
altura como o peso são medidos diretamente e o IMC é calculado conforme descrito
anteriormente. Na amostra do sétimo exame do Framingham Offspring Study, 28% dos pacientes
apresentam peso normal, 41,3% são classificados com sobrepeso e 30,1% são obesos. Usando
a frequência relativa acumulada, podemos dizer que quase 70% dos pacientes estão abaixo do
peso, com peso normal ou com sobrepeso. Isso é o mesmo que dizer que 70% dos pacientes da
amostra não são obesos.
TABELA 4-8 Tabela de distribuição de frequência para categorias de Índice de massa corporal
Frequência relativa
Frequência Frequência Relativa (%) Frequência acumulada acumulada (%)
Abaixo do peso 20 0,6 20 0,6
Peso normal 932 28,0 932 28,6
Sobrepeso 1374 41,3 2326 69,9
Obeso 1000 30,1 3326 100,0
Total 3326 100,1
As tabelas 4–5 a 4–8 contêm estatísticas resumidas para variáveis ordinais. As principais
estatísticas resumidas para variáveis ordinais são frequência relativa e frequência relativa
acumulada. As tabelas 4–9 a 4–11 contêm estatísticas resumidas para variáveis categóricas.
Variáveis categóricas são aquelas com duas ou mais respostas distintas, sendo que estas não
são ordenadas. Alguns exemplos de variáveis categóricas mensuradas no Framingham Heart
Study são: estado civil, mão dominante e tabagismo. Tabelas de distribuição de frequência
contendo frequência e frequência relativa fornecem resumos adequados das variáveis
categóricas. Frequência acumulada e frequência relativa acumulada normalmente não são úteis
para resumir variáveis categóricas, pois como não há ordem inerente às categorias, não é
interessante combiná-las.
A Tabela 4–9 mostra a tabela de distribuição de frequência para a variável categórica estado
civil. As categorias mutuamente exclusivas e exaustivas encontram-se na primeira coluna. A
frequência, ou o número de participantes em cada categoria, é apresentada na coluna do meio,
e a frequências relativa, em porcentagem, está na coluna à direita. Há n=3530 respostas válidas
para a pergunta sobre estado civil. Nove participantes não responderam à esta pergunta. A
amostra é composta majoritariamente por pessoas casadas (73,1%); aproximadamente 10% são
divorciados, 10% são viúvos, 6% são solteiros e 1% são separados. A frequência relativa é a
estatística mais relevante para descrever uma variável categórica. Frequência acumulada e
frequência relativa acumulada geralmente não são estatísticas descritivas informativas para
variáveis categóricas.
Estado civil é uma variável categórica; como não há uma ordem a seguir para as respostas, a
primeira coluna pode ser organizada de formas diferentes. Por exemplo, às vezes as respostas
são listadas da mais frequente a menos frequente, ou as repostas podem ser apresentadas em
ordem alfabética. Qualquer ordem pode ser considerada apropriada. Por outro lado, respostas a
variáveis ordinais são ordenadas e, portanto, somente podem ser apresentadas do maior para o
menor (mais saudável a menos saudável) ou vice-versa. As opções de resposta em escala
ordinal não podem ser reorganizadas.
Frequência
Frequência Relativa (%)
Solteiro 203 5,8
Casado 2850 73,1
Viúvo 334 9,5
Divorciado 367 10,4
Separado 46 1,3
Total 3530 100,0
A Tabela 4–10 é uma tabela de distribuição de frequência para uma variável categórica
dicotômica. Variáveis dicotômicas são um caso especial de variáveis categóricas com
exatamente duas opções de resposta. A Tabela 4–10 mostra a distribuição da mão dominante de
participantes que compareceram ao sétimo exame do Framingham Offspring Study. As opções
de resposta são "direita" ou "esquerda". Há n = 3.513 respostas válidas para a avaliação da mão
dominante. Um total de 26 participantes não forneceu dados sobre a mão dominante. A maioria
da amostra de Framingham é destra (89,5%). A Tabela 4–11 é uma tabela de distribuição de
frequência para uma variável categórica que reflete a posição do tabagismo. A posição do
tabagismo aqui é medida como não fumante, ex-fumante ou fumante atualmente. Há n = 3.536
respostas válidas para as perguntas sobre a condição do tabagismo. Três participantes não
forneceram dados adequados a serem classificados. Quase metade da amostra é de ex-
fumantes (48,8%), mais de um terço (37,6%) nunca fumou e aproximadamente 14% são
fumantes atualmente. Os efeitos do tabagismo adversos à saúde foram um grande foco das
mensagens de saúde pública em anos recentes, e o percentual de participantes que se declaram
fumantes atualmente deve ser interpretado com relação ao período do estudo. A Tabela 4–12
mostra as proporções dos participantes que se declaram fumantes atualmente no momento de
cada exame do Framingham offspring. As datas de cada exame também são fornecidas.
TABELA 4-10 Tabela de distribuição de
frequência para mão dominante
Frequência
Frequência relativa (%)
Direita 3.143 89,5
Esquerda 370 10,5
Total 3.513 100,0
Ciclo do Fumantes
exame Datas atualmente (%)
Ago 1971-Set 1975 59,7
Out 1979-Out 1983 28,5
Dez 1983-Set 1987 23,9
Abr 1987-Set 1991 21,7
Jan 1991-Jun 1995 17,4
Jan 1995-Set 1998 13,8
Set 1998-Out 2001 13,6
Nas próximas duas seções, apresentamos exibições gráficas para variáveis ordinais e
categóricas, respectivamente. Enquanto os resumos numéricos para variáveis ordinais e
categóricas são idênticos (pelo menos em termos das frequências e frequências relativas), as
exibições gráficas para variáveis ordinais e categóricas são diferentes, em um modo muito
importante.
CAPÍTULO 6: Estimativas de intervalo de confiança
PÁGINAS 101-102
Começamos agora a inferência estatística. No Capítulo 4, apresentamos estatísticas descritivas
usadas para resumir os dados da amostra. No Capítulo 5, apresentamos os principais conceitos
de probabilidade e o Teorema central do limite. Na inferência estatística, usamos todos esses
conceitos para fazer inferências sobre parâmetros de população desconhecidos com base em
estatísticas de amostra. Há duas grandes áreas de inferência estatística: estimativa e teste de
hipóteses. Na estimativa, as estatísticas de amostra são usadas para gerar estimativas sobre
parâmetros de população desconhecidos. No teste de hipóteses, uma declaração específica ou
hipótese é gerada sobre um parâmetro de população, e as estatísticas da amostra são usadas
para avaliar a probabilidade de que a hipótese seja verdadeira. Discutimos estimativa aqui e
apresentamos o teste de hipóteses no Capítulo 7.
As técnicas para estimativa, bem como para outros procedimentos em inferência estatística,
dependem da classificação adequada da principal variável do estudo (que também chamamos
de resultado ou meta final) como contínua ou dicotômica. (Há outros tipos de variáveis, que são
discutidas nos Capítulos 7, 10 e 11; aqui focamos em resultados contínuos e dicotômicos.) Outro
assunto importante é o número de grupos de comparação na investigação. Por exemplo, no caso
do grupo de duas comparações é importante determinar se as amostras dos grupos são
independentes (isto é, fisicamente separadas, como homens contra mulheres) ou dependentes
(também chamadas de combinadas ou correlacionadas). Essas questões ditam a técnica de
estimativa adequada. A Tabela 6–1 descreve essas questões e identifica as técnicas de
estimativa que discutimos aqui.
Suponha que foquemos no peso médio dos homens. Em 2002, o peso médio para os homens
era relatado em 86,5 quilos. Suponha que um pesquisador trace a hipótese de que os pesos
sejam ainda maiores em 2006 (ou seja, que a tendência continuou nos 4 anos seguintes). Em
um teste de hipóteses, configuramos hipóteses concorrentes sobre o parâmetro desconhecido.
Uma hipótese é chamada de hipótese nula, e a outra é chamada de hipótese alternativa ou de
pesquisa. A hipótese de pesquisa é de que o peso médio dos homens em 2006 seja superior a
86,5 quilos. A hipótese nula é que não haja alteração no peso e, portanto, o peso médio ainda
seja 86,5 quilos em 2006. As hipóteses nula e de pesquisa são denotadas como
197,1 − 191
Ρ(𝑋𝑋� > 197,1) = Ρ �𝑧𝑧 > � = Ρ (𝑧𝑧 > 2,38) = 1 − 0,9913 = 0,0087
25,6
√100
(Observe que usamos o desvio padrão da amostra para computar a pontuação z. Geralmente,
trata-se de uma substituição adequada, desde que a amostra seja grande, n> 30.) Assim, há
menos de 1% de chance de observar uma média de amostra da ordem de 89,5 kg quando a
média populacional real for 86,5. Você acha que a hipótese nula é provavelmente verdadeira?
Com base na improbabilidade de observar uma média de amostra de 89,5 abaixo da hipótese
nula (isto é, chance menor que 1%), podemos inferir, a partir dos nossos dados, que a hipótese
nula provavelmente não seja verdadeira.
Suponha que os dados da amostra tenham sido diferentes. Suponha que, em 2006, observamos
o seguinte: n = 100, Χ� = 192,1, s = 25,6. Qual é a probabilidade de observar uma média de
amostra de 87 ou mais quando a verdadeira média da população é 86,5 (isto é, se a hipótese
nula for verdadeira)? Computamos outra vez essa probabilidade usando o Teorema central do
limite. Especificamente:
192,1 − 191
Ρ(𝑋𝑋� > 192,1) = Ρ �𝑧𝑧 > � = Ρ (𝑧𝑧 > 0,43) = 1 − 0,6664 = 0,3336
25,6
√100
Há uma chance de que 33,4% da observação da média de uma amostra tão grande quanto 87
quando a verdadeira média da população é 86,5. Você acha que a hipótese nula é provavelmente
verdadeira?
Precisamos determinar um limiar ou um ponto de corte (chamado de valor crítico) para decidir
quando acreditar na hipótese nula e quando acreditar na hipótese de pesquisa. É importante
observar que, embora seja possível observar qualquer média da amostra quando a verdadeira
média da população é 86,5, alguns valores são bastante improváveis. Com base nas duas
amostras anteriores, parece razoável acreditar na hipótese de pesquisa quando Χ� = 89,5, mas
para acreditar na hipótese nula quando Χ� = 87. O que precisamos é de um valor limiar tal que se
Χ� estiver acima desse limiar, acreditamos que H1 seja verdadeira e se Χ� estiver abaixo desse
limiar, acreditamos que H0 seja verdadeira. A dificuldade em determinar um limiar para Χ� é que
ele depende da escala de medição. Neste exemplo, o valor crítico pode ser 88,5 quilos (isto é,
se a média da amostra for 88,5 quilos ou mais, acreditamos que H1 seja verdadeira e se a média
da amostra for menor que 88,5 quilos, acreditamos que H0 seja verdadeira). Suponha que
estejamos interessados em avaliar um aumento na pressão sanguínea ao longo do tempo. O
valor crítico seria diferente, pois pressões sanguíneas são medidas em milímetros de mercúrio
(mmHg) e não em quilos. A seguir, explicamos como o valor crítico é determinado e como lidamos
com o problema da escala.
Primeiro, para abordar o problema da escala para determinar o valor crítico, convertemos nossos
dados da amostra (em particular, a média da amostra) em uma pontuação z. Sabemos, desde o
Capítulo 5, que o centro da distribuição z é 0 e os valores extremos são os que excedem 2 ou
recaem abaixo de 22 (valores acima de 2 e abaixo de 22 representam aproximadamente 5% de
todos os valores z). Se a média da amostra observada estiver perto da média especificada em
H0 (µ =191), então z é próximo a 0. Se a média da amostra observada for muito maior do que a
média especificada em H0, então z é amplo.
Por α ser uma probabilidade, ele fica entre 0 e 1. O valor usual para α é 0,05, ou 5%. Se um
pesquisador selecionar α = 0,05, ele/ela está permitindo uma probabilidade de 5% de rejeitar
incorretamente a hipótese nula em favor da alternativa quando a nula for verdadeira. Os valores
típicos para α são 0,01, 0,05 e 0,10, com α = 0,05 sendo o valor mais comumente usado.
Suponha que no nosso estudo sobre peso tenhamos selecionado α = 0,05. Precisamos
determinar o valor de z que mantenha 5% dos valores acima dele (Figura 7–1). O valor crítico de
z para α = 0,05 é z = 1,645 (ou seja, 5% da distribuição está acima de 1,645). Com esse valor,
podemos definir o que chamamos nossa regra de decisão para o teste. A regra é rejeitar H0 se
a pontuação z for 1,645 ou mais.
Com a primeira amostra, temos Χ� = 197,1 e z = 2,38. Por causa de 2,38 > 1,645, rejeitamos a
hipótese nula. (A mesma conclusão pode ser atingida comparando a probabilidade de 0,0087 de
observar uma média da amostra tão extrema quanto 89,5 para o nível de significância de 0,05.
Se a probabilidade observada for menor que o nível de significância, rejeitamos H0.) Como a
causa da pontuação z excede o valor crítico (2,38 > 1,645), concluímos que o peso médio para
os homens em 2006 é superior a 86,5 quilos, o valor reportado em 2002. Se observássemos a
segunda amostra (Χ� = 192,1), não rejeitaríamos a hipótese nula, porque a pontuação z é 0,43,
que não está na região de rejeição (isto é, a região na extremidade da cauda da curva em 1,645
ou acima desse valor). Com a segunda amostra, não temos evidências para concluir que os
pesos aumentaram. (Mais uma vez, a mesma conclusão pode ser atingida comparando-se
probabilidades. A probabilidade de observar uma média da amostra tão extrema quanto 87 é de
33,4%, o que não está abaixo do nosso nível de 5% de significância.)
FIGURA 7-1 Valor crítico de Z para α = 0,05
0,05
1,645
A hipótese de pesquisa ou alternativa pode tomar uma das três formas. Um pesquisador pode
acreditar que o parâmetro aumentou, diminuiu ou foi alterado. Por exemplo, um pesquisador
pode criar a hipótese:
1. H1: µ> µ 0, em que µ 0 é o comparador ou valor nulo (p. ex., µ 0 =191 no nosso exemplo
sobre peso de homens, em 2006) e um aumento é a hipótese – esse tipo de teste é
chamado de teste de cauda superior.
2. H1: µ< µ 0, em que uma diminuição é a hipótese – chamado de teste de cauda inferior.
3. H1: µ≠ µ 0, em que uma diferença é a hipótese – chamado de teste bicaudal.
A forma exata da hipótese de pesquisa depende da convicção do pesquisador sobre o parâmetro
de interesse e se ele possivelmente aumentou, diminuiu ou está diferente do valor nulo. A
hipótese de pesquisa é definida pelo pesquisador antes que qualquer dado seja coletado.
Χ� − 𝜇𝜇0
𝑧𝑧 =
𝑠𝑠/√𝑛𝑛
A forma exata da estatística de teste também é importante para determinar a regra de decisão.
Se a estatística do teste segue a distribuição normal padrão (z), a regra de decisão é baseada
na distribuição padrão normal. Se a estatística do teste segue a distribuição t, a regra de decisão
é baseada na distribuição t. O valor crítico adequado é selecionado da distribuição t, novamente
dependendo da hipótese alternativa específica e do nível de significância.
O terceiro fator é o nível de significância, que é selecionado na Etapa 1 (p. ex., α = 0,05). Por
exemplo, em um teste de cauda superior z, se α = 0,05, o valor crítico é z = 1,645.
As Figuras 7–2 até a Figura 7–4 ilustram as regiões de rejeição definidas pela regra de decisão
para testes z de cauda superior, inferior e bicaudais com α = 0,05. Observe que as regiões de
rejeição estão nas caudas superior, inferior e em ambas as curvas, respectivamente. Observe,
no teste bicaudal, que a região de rejeição está dividida em duas partes iguais. A área total na
região de rejeição ainda é igual a α. Na Figura 7–4, α = 0,05 e a área em cada cauda é 0,025.
Os valores críticos dos testes z de cauda superior, inferior e bicaudais podem ser encontrados
na Tabela 1C, no Apêndice. Os valores críticos dos testes z de cauda superior, inferior e bicaudais
podem ser encontrados na Tabela 2, no Apêndice.
FIGURA 7-2 Região de rejeição para teste Z de cauda superior
(H1: µ > µ 0) com α = 0,05
0,05
1,645
0,05
-1,645
FIGURA 7-4 Região de rejeição para teste Z bicaudal
(H1: µ ≠ µ 0) com α = 0,05
-1,960 1,960
Etapa 5: Conclusão.
A conclusão final é feita comparando-se a estatística de teste (que é um resumo das informações
observadas na amostra) com a regra de decisão. A conclusão final é, ou rejeitar a hipótese nula
(pois os dados da amostra são muito improváveis se a hipótese nula for verdadeira) ou não
rejeitar a hipótese nula (pois os dados da amostra não são muito improváveis).
CAPÍTULO 9: Métodos multivariáveis
PÁGINAS 193-195
Nos Capítulos 6 e 7, apresentamos procedimentos de inferência estatística para estimativa e
teste de hipóteses. Discutimos vários cenários que diferem em termos de natureza da variável
de resultado (contínua, dicotômica, categórica ou ordinal), o número de grupos de comparação
(um, dois ou mais de dois), e se os grupos eram independentes (fisicamente separados) ou
dependentes (combinados). Em cada cenário, consideramos uma variável de resultado e
investigamos se havia diferenças nessa variável de resultado entre os grupos de comparação ou
se houve uma associação entre uma exposição ou fator de risco e um resultado. O que não
consideramos até este ponto é a possibilidade de que diferenças ou associações observadas
podem se dar devido a outras características ou variáveis. Métodos estatísticos multivariáveis
são usados para avaliar as inter-relações entre diversos fatores de risco ou variáveis de
exposição e um único resultado. O tópico de análise multivariável é extensivo. Aqui, descrevemos
apenas princípios gerais e conceitos. Os leitores interessados devem consultar Kleinbaum,
Kupper e Muller; Jewell; e Hosmer e Lemeshow, para uma discussão mais aprofundada.
Métodos multivariáveis também podem ser usados para avaliar a modificação de efeito –
especificamente, a situação em que o relacionamento entre um fator de risco e o resultado de
interesse varia por causa de uma terceira variável. Por exemplo, suponha que estejamos
interessados na eficácia de uma nova droga para reduzir o colesterol total. Um ensaio clínico é
conduzido e se comprova que a droga é eficaz, com uma redução estatisticamente significativa
no colesterol total em pacientes que recebem a nova droga, em comparação a pacientes que
recebem placebo. Suponha que os pesquisadores analisem mais de perto os dados e descubram
que a redução (ou efeito da droga) está presente apenas em participantes com um marcador
genético específico e que não há redução em pessoas que não possuem o marcador. Isso é um
exemplo de modificação de efeito, ou interação estatística. O efeito do tratamento é diferente,
dependendo da presença ou ausência do marcador genético. Métodos multivariáveis podem ser
usados para identificar modificação de efeito. Quando a modificação de efeito está presente, a
estratégia é apresentar resultados separados de acordo com a terceira variável (isto é, relatar o
efeito do tratamento separadamente em pessoas com e sem o marcador).
Há muitos outros usos dos métodos multivariáveis. Focamos aqui apenas em algumas
aplicações específicas. As computações são intensivas e, por isso, nossa apresentação é mais
geral, com ênfase especial em interpretação, e não em computação. Na prática, as computações
são feitas usando um pacote de computação estatística.6
É importante observar que a análise estatística de qualquer estudo deve começar com uma
descrição completa dos dados do estudo, usando os métodos descritos no Capítulo 4. As
análises primárias devem proceder, conforme planejado, para gerar estimativas de parâmetros
desconhecidos ou executar testes de hipóteses usando as técnicas descritas no Capítulo 6 e no
Capítulo 7, respectivamente. As análises que apresentamos no Capítulo 6 e no Capítulo 7 são
chamadas de análises não ajustadas ou cruas, já que focam exclusivamente na associação entre
um fator de risco ou exposição e o resultado. Métodos multivariáveis são usados após os dados
do estudo serem descritos e após as análises não ajustadas serem feitas. Na configuração de
ensaios clínicos, as análises não ajustadas geralmente são as análises finais, devido,
primeiramente, ao componente da escolha aleatória que, (em teoria), elimina a possibilidade de
confusão. Enquanto os métodos multivariáveis que descrevemos são formas de dar conta da
confusão, não se deve confiar neles para "corrigir" problemas em um estudo.
Modelos multivariáveis são usados para o ajuste estatístico da confusão, enquanto o projeto
cuidadoso do estudo pode oferecer muito mais no que diz respeito a minimizar a confusão. A
escolha aleatória é uma forma muito eficaz de minimizar a confusão. Infelizmente, nem todos os
estudos se enquadram na escolha aleatória. Há outras opções de minimizar a confusão (p. ex.,
combinação), mas em todos os casos é importante reconhecer que modelos multivariáveis
podem apenas ajustar ou dar conta de diferenças em variáveis que confundem medidas no
estudo. Portanto, os pesquisadores devem planejar cuidadosamente os estudos, não apenas
com um olhar em direção a minimizar confusão sempre que possível, mas também com a
prudência de medir variáveis que possam ser possíveis fatores de confusão.
Tufte recomenda honestidade na visualização dos dados e clareza na apresentação. Uma forma
de chegar a isso é minimizando o que ele chama de "lixo gráfico". Lixo gráfico se refere a recursos
desnecessários em uma tabela ou figura que não transmitem nenhum significado. Tufte
argumenta que o lixo gráfico prejudica a mensagem principal da tabela ou da figura. Em
contraste, ele favorece as apresentações de dados que incentivam a comparação como uma
forma específica de envolver-se com os dados e resultados estatísticos. Para facilitar esse tipo
de envolvimento, as tabelas e figuras devem ser configuradas de modo que forneçam, aos
leitores ou consumidores, os dados corretos e suficientemente detalhados para tornar as
comparações válidas e para descobrir o significado, conforme eles exploram os dados ou
resultados estatísticos.
Outro conjunto de princípios voltado para exibições gráficas, mas também aplicável a
demonstrações tabulares, são os princípios de CONVINCE para a visualização de dados
eficiente. Os princípios de CONVINCE são consistentes com aqueles estabelecidos por Tufte,
mas reforçam questões essenciais e são fáceis de lembrar pelo acrônimo:
Um terceiro conjunto de princípios vem de Steven Few, que sugere oito ideias ou princípios
nucleares para a visualização de dados.5 Mais uma vez, os princípios de Few são voltados para
figuras, mas, de modo geral, podem ser aplicados para tabelas e figuras. Ele nos obriga a:
Antes de nos aprofundarmos ainda mais no desenvolvimento de tabelas e figuras eficientes, vale
a pena repetir várias mensagens de suma importância. Não importa em que formato escolhemos
relatar os nossos dados e resultados estatísticos, precisamos defender a ideia do porquê os
dados e resultados estatísticos serem importantes – ou seja, por quê o leitor deveria se interessar
por eles. Devemos destacar os elementos importantes, sermos claros em nosso processo (quais
etapas seguimos e por que), para garantir que o leitor ou o consumidor possa focar nos aspectos
mais importantes dos dados e resultados estatísticos. Nossa meta final é nos certificarmos de
que nossa mensagem seja precisa, clara e inesquecível.
12.3.1 COMPONENTES DE UMA TABELA
Boas tabelas têm um título claro e conciso. O título deve ser suficientemente claro para que o
leitor não precise voltar ao texto para entender o que está sendo mostrado na tabela. O título
deve descrever o que está sendo mostrado entre quem (ou seja, principais grupos de
comparação) e quando. Via de regra, não deve ter mais de duas linhas e deve aparecer na parte
superior da tabela. As tabelas de um artigo ou relatório também devem ser numeradas na ordem
em que são mencionadas nesse artigo ou relatório. A menos que a revista, site ou cliente
recomendem o contrário, as tabelas devem ser incluídas no trabalho ou relatório bastante
próximas ao local onde os dados ou resultados estatísticos são discutidos, e não no final, o que
pode dificultar a consulta enquanto o leitor lê o texto. Tabelas muito longas com mais detalhes
granulares podem ser movidas para um apêndice ou, se disponível, um suplemento on-line.
Cada coluna da tabela deve também ter um cabeçalho claro. Os cabeçalhos da coluna devem
ser suficientemente concisos para que não ultrapassem uma linha. Um cabeçalho por coluna é
o suficiente, já que mais de um cabeçalho pode gerar confusão. Uma chave de coluna, que
descreve a variável de agrupamento (p. ex., "Tratamento"), aparece acima dos cabeçalhos de
coluna. Às vezes, os cabeçalhos da coluna são suficientes para descrever e diferenciar os
grupos, outras vezes, uma chave de coluna é necessária para esclarecer o significado. A chave
de coluna é, às vezes, usada para descrever as estatísticas que serão mostradas nas colunas –
como exemplo, veja como tabulamos os resultados de uma análise de regressão no Exemplo
12.1.
Muitas vezes, variáveis diferentes são mostradas nas linhas de uma tabela. Nomes e unidades
de variáveis de medida devem ser especificados de modo claro e preciso. As unidades de medida
são extremamente importantes. Algumas medidas clínicas e laboratoriais, por exemplo, podem
ser medidas e relatadas regularmente usando diferentes escalas, portanto, é essencial que as
unidades exatas sejam relatadas para garantir que os leitores e consumidores possam fazer
comparações válidas. Assim como revistas têm guias de estilo específicos para relatar dados e
resultados estatísticos em tabelas e figuras, há também diretrizes para relatar medidas clínicas
e laboratoriais que devem ser consultadas ao relatar tais dados. Algumas revistas, sites ou
clientes podem preferir unidades métricas (p. ex., metros e gramas) a unidades imperiais (dos
EUA) (p. ex., pés, libras), e suas convenções devem ser seguidas, conforme for adequado. Os
dados devem ser arredondados tanto quanto for apropriado; geralmente, duas casas decimais
são mais do que suficientes.
Linhas de grade, que muitas vezes são vistas em planilhas, são desnecessárias em tabelas; na
verdade, podem dificultar a leitura dos dados em uma tabela. Deve haver algumas linhas, se for
o caso, no corpo da tabela. A tabela deve usar espaçamento consistente e as colunas devem
estar razoavelmente perto para facilitar as comparações de interesse. Espaço em branco ao
redor da tabela e estrategicamente posicionado dentro da tabela pode ajudar a destacar
determinados aspectos dos dados e resultados estatísticos. O objetivo é a clareza – criar uma
tabela que permita que o leitor ou o consumidor se aprimore sobre as principais mensagens dos
dados e resultados estatísticos.
Exemplo 12.1. A análise de regressão logística é usada para avaliar as associações entre as
categorias de índice de massa corporal (IMC) – normal (IMC ≤ 25,0), sobrepeso (25,0 < IMC <
30,0) e obeso (IMC ≥ 30,0) – e três resultados – enfarte do miocárdio incidental, doença
cardiovascular incidental e derrame incidental, que são considerados separadamente. A Tabela
12–1 resume as associações entre categorias de IMC (peso normal, sobrepeso e obesidade)
usando razões de chances e intervalos de confiança de 95% para razões de chances. A Tabela
12–2 mostra os mesmos dados que a Tabela 12–1, mas sem linhas de grade e um pouco mais
de espaçamento. Qual tabela é mais fácil de ler?
TABELA 12-1 Associação entre categorias de IMC e doença cardiovascular
incidental após ajuste para fatores de risco clínicos*
Razão de possibilidades* (OR) (95% de intervalo de confiança)
Peso normal Sobrepeso Obeso
Enfarto do miocárdio incidental 1,00 (Referência) 1,01 (0,69-1,29) 1,14 (1,01-1,50)
Doença cardiovascular incidental 1,00 (Referência) 1,21 (0,89-1,37) 1,36 (1,13-2,54)
Derrame incidental 1,00 (Referência) 0,99 (0,82-1,08) 1,18 (1,09-1,23)
* Ajustado para idade, sexo, pressão sanguínea diastólica e sistólica, colesterol sérico total, lipoproteína de alta densidade e tabagismo;
peso normal (índice de massa corporal [IMC]≤ 25,0), sobrepeso (25,0 < IMC < 30,0) e obeso (IMC ≥ 30,0).
* Ajustado para idade, sexo, pressão sanguínea diastólica e sistólica, colesterol sérico total, lipoproteína de alta densidade e tabagismo;
peso normal (índice de massa corporal [IMC]≤ 25,0), sobrepeso (25,0 < IMC < 30,0) e obeso (IMC ≥ 30,0).
Notas de rodapé, como as notas nas partes inferiores das Tabelas 12–1 e 12–2, podem ser
usadas para fornecer informações adicionais necessárias para interpretar os dados ou resultados
estatísticos apresentados na tabela. Tais explicações não devem ser incluídas nos cabeçalhos
das colunas ou no título, já que podem diminuir a interpretabilidade dos resultados. Todas as
abreviações e símbolos podem ser esclarecidos nas notas de rodapé. A Tabela 12–3 mostra os
mesmos dados que as Tabelas 12–1 e 12–2, mas usa abreviações de alguns dos resultados para
aumentar a legibilidade. As abreviações são explicadas nas notas de rodapé. A decisão de usar
ou não abreviações depende do público. Se o público estiver familiarizado com as abreviações,
elas podem promover a legibilidade. Se o público não estiver familiarizado com as abreviações,
elas dão mais trabalho para localizar as definições.
Proficiência em inglês
Sem proficiência prática x,xx
Proficiência elementar
Proficiência limitada
Proficiência total
Proficiência nativa ou bilíngue
* Valores p para medidas contínuas com base em duas amostras independentes do teste t; valores p para características categóricas
com base nos testes qui-quadrados de independência.
Apenas um tipo de fonte deve ser usado em uma tabela; itálico, negrito e outros destaques devem
ser usados com moderação, se necessário. Às vezes, os criadores de tabelas querem ter certeza
de que o leitor ou consumidor encontre os dados principais ou faça as comparações principais,
mas, se a tabela for organizada adequadamente, isso deve ser autoevidente. Há exceções: Por
exemplo, o uso de negrito pode ser útil quando houver grande quantidade de dados para
entender e pode ser útil chamar a atenção para aspectos específicos dos dados. A Tabela 12–5
e a Tabela 12–6 mostram os mesmos dados com e sem destaques. Os destaques são úteis?
Observe que alguns podem ser úteis, enquanto outros geram confusão.
Quando um trabalho ou relatório incluir uma série de tabelas com os mesmos grupos de
comparação, a organização dos grupos de comparação deve ser consistente em todas as
tabelas. Nunca devemos reordenar os grupos ou trocar a orientação das tabelas (isto é, trocar
de linhas para colunas).
TABELA 12-5 Impacto de alto consumo* de grãos TABELA 12-6 Impacto de alto consumo* de grãos
e doença cardiovascular incidental e câncer e doença cardiovascular incidental e câncer
Pão integral 0,85 (0,72, 0,97) Pão integral 0,85 (0,72, 0,97)
Cereal integral 0,71 (0,63, 0,84) Cereal integral 0,71 (0,63, 0,84)
Grãos refinados 1,05 (0,87, 1,36) Grãos refinados 1,05 (0,87, 1,36)
Pão branco 1,10 (0,95, 1,30) Pão branco 1,10 (0,95, 1,30)
Arroz (branco e integral) 0,99 (0,92, 1,04) Arroz (branco e integral) 0,99 (0,92, 1,04)
Grãos totais 1,03 (0,91, 1,24) Grãos totais 1,03 (0,91, 1,24)
Câncer incidental Câncer incidental
Pão integral 0,91 (0,77, 0,99) Pão integral 0,91 (0,77, 0,99)
Cereal integral 0,91 (0,86, 0,97) Cereal integral 0,91 (0,86, 0,97)
Grãos refinados 0,97 (0,84, 1,06) Grãos refinados 0,97 (0,84, 1,06)
Pão branco 1,01 (0,95, 1,13) Pão branco 1,01 (0,95, 1,13)
Arroz (branco e integral) 0,94 (0,87, 1,02) Arroz (branco e integral) 0,94 (0,87, 1,02)
Grãos totais 0,95 (0,86, 1,11) Grãos totais 0,95 (0,86, 1,11)
* Alto consumo é consumo acima da média. * Alto consumo é consumo acima da média.
Exemplo 12.8. É feito um estudo para medir as idades de mães que passaram pela perda de
uma criança por síndrome da morte súbita infantil (SIDS), definida como morte devido a causa
desconhecida antes de 1 ano de idade. Uma amostra de n = 9 crianças é identificada para as
quais a causa da morte foi SIDS. As idades das mães, em anos, são as seguintes e estão
demonstrada em um gráfico dotplot na Figura 12–18:
19 21 26 28 30 32 33 39 30
FIGURA 12–18 Distribuição das idades das mães
em um estudo da síndrome da morte súbita infantil
Gráficos de barras são usados para resumir variáveis dicotômicas e categóricas e são
considerados as figuras mais fáceis de construir e entender. Em muitos estudos, é importante
mostrar a distribuição de uma característica particular na amostra do estudo ou em subgrupos-
chave da amostra.
Novamente, considere o Exemplo 12.7, que discute os dados extraídos do relatório de avaliação
de pessoas sem-teto de 2015 da Agência de Planejamento e Desenvolvimento Comunitário
(Office of Community Planning and Development).
A Figura 12–19 mostra a distribuição racial/étnica das pessoas sem-teto (como vimos no
Capítulo 4, em que raça/etnia é uma variável categórica, portanto, um gráfico de barras é uma
exibição gráfica adequada).
Percentual
Multirraças
procedentes das
ilhas do Pacífico
Raça/Etnia
Nativo-americano
Asiático
Afro-americano
Branco
Percentual
Dados do Departamento de Habitação e Desenvolvimento Urbano dos EUA, Agência de Planejamento e Desenvolvimento
Comunitário (US Department of Housing and Urban Development, Office of Community Planning and Development) Estimativas
de ponto no tempo de pessoas sem-teto: Relatório Anual de Avaliação de Pessoas Sem-Teto 2015 [The 2015 Annual Homeless
Assessment Report (HAR)] para o Congresso. https://www.hudexchange.info/resources/documents/2015-AHAR-Part-1.pdf.
Novembro de 2015.
A Figura 12–21 mostra os percentuais de pessoas sem-teto abrigadas e desabrigadas em 2015
por grupo etário. Devido às pessoas sem-teto serem classificadas como abrigadas ou
desabrigadas (uma variável dicotômica), podemos simplificar a apresentação e mostrar apenas
uma das respostas – por exemplo, os percentuais de desabrigados (Figura 12–22). Qual
apresentação comunica os dados com mais eficiência?
Abaixo de 18 18 a 24 Acima de 24
Abrigados Desabrigados
Dados do Departamento de Habitação e Desenvolvimento Urbano dos EUA, Agência de Planejamento e Desenvolvimento
Comunitário (US Department of Housing and Urban Development, Office of Community Planning and Development) Estimativas
de ponto no tempo de pessoas sem-teto: Relatório Anual de Avaliação de Pessoas Sem-Teto 2015 [The 2015 Annual Homeless
Assessment Report (HAR)] para o Congresso. https://www.hudexchange.info/resources/documents/2015-AHAR-Part-1.pdf.
Novembro de 2015.
FIGURA 12–22 Percentuais de pessoas sem-teto que estão
desabrigadas por grupo etário
Percentual de desabrigados
Abaixo de 18 18 a 24 Acima de 24
Idade, anos
Dados do Departamento de Habitação e Desenvolvimento Urbano dos EUA, Agência de Planejamento e Desenvolvimento
Comunitário (US Department of Housing and Urban Development, Office of Community Planning and Development) Estimativas
de ponto no tempo de pessoas sem-teto: Relatório Anual de Avaliação de Pessoas Sem-Teto 2015 [The 2015 Annual Homeless
Assessment Report (HAR)] para o Congresso. https://www.hudexchange.info/resources/documents/2015-AHAR-Part-1.pdf.
Novembro de 2015.
Histogramas são usados para resumir as distribuições de variáveis ordinais. Por exemplo, a
Figura 12–23 mostra o número de horas de atividade física por semana (uma variável ordinal,
com respostas que variam de 0 a 15 horas por semana) para participantes que compareceram
ao nono exame do Framingham Offspring Study.
A distribuição de uma variável contínua também pode ser exibida em um histograma criando-se
grupos para resumir os dados para apresentação. Os grupos podem ser definidos para incluir
percentuais especificados dos dados (p. ex., 10 grupos, ou décimos) ou por limites clinicamente
relevantes (p. ex., categorias de índice de massa corporal normal, sobrepeso e obeso; categorias
de pressão sanguínea sistólica ótima, normal, pré-hipertensão e hipertensão). Histogramas
podem ser feitos para mostrar frequências ou frequências relativas – a que for melhor para
transmitir a mensagem. Como exemplo, a Figura 12–24 mostra a distribuição de colesterol sérico
total, medido como variável contínua em miligramas por decilitro (mg/dl), em uma amostra de
mais de 4.000 participantes. As medidas contínuas são organizadas em recipientes de
aproximadamente 50 unidades de mg/dl cada (p. ex., 100–150 mg/dl, 150–200 mg/dl) para
apresentação.
FIGURA 12–23 Horas de atividade física por semana
Percentual
Diagramas de caixa também são úteis para comparar distribuições de variáveis contínuas entre
grupos. Por exemplo, a Figura 12–26 mostra as distribuições do colesterol sérico total em
homens e mulheres. Qual a comparação entre o colesterol sérico total em homens e mulheres?
FIGURA 12–26 Distribuição do colesterol sérico total (mg/dl) em homens e mulheres
Masculino Feminino
Nos Capítulos 6, 7, 10 e 11, discutimos várias técnicas estatísticas para comparar dois ou mais
grupos em resultados dicotômicos, categóricos, ordinais, contínuos e no momento do evento.
Com resultados dicotômicos, categóricos e ordinais, a comparação é geralmente de proporções
ou percentuais. Com resultados contínuos, geralmente se envolvem médias, presumindo que
tenhamos amostras razoavelmente amplas e resultados distribuídos de modo aproximadamente
normal; do contrário, focamos em comparar distribuições usando testes não paramétricos. Com
resultados no momento do evento, geralmente comparamos curvas de sobrevivência. Não
importando as estatísticas que são comparadas, como prática geral, devemos também
apresentar estimativas de variabilidade, tais como erros padrão ou intervalos de confiança para
cada grupo, para que os leitores possam julgar se os grupos são significativamente diferentes.
Considere novamente o Exemplo 12.4, que descreveu um estudo de coorte que avaliou
diferenças entre pesos ao nascer e outros resultados de gravidez de bebês nascidos de mães
de diferentes contextos raciais/étnicos. Suponha que estejamos interessados em estimar e
comparar pesos médios ao nascer, em gramas, por raça/etnia. A Figura 12–27 apresenta pesos
médios ao nascer junto com erros padrão dos pesos médios ao nascer em cada grupo
racial/étnico.
Raça da mãe/Etnia
Erros padrão quantificam a variabilidade nas estimativas do peso médio ao nascer em cada
grupo. Suponha que uma análise de variância seja feita e revele uma diferença estatisticamente
significativa em pesos médios ao nascer entre os três grupos raciais/étnicos com p = 0,04. Pode
ser interessante também avaliar diferenças em pares nos pesos médios ao nascer. Poderíamos
fazer três testes t de duas amostras independentes (comparando os pesos médios ao nascer
entre bebês brancos e hispânicos, bebês brancos e negros e bebês negros e hispânicos), mas
isso aumentaria a taxa geral de erro do Tipo I. Uma abordagem melhor é conduzir um
procedimento de comparação múltipla, que permite várias comparações de pares, mas controla
a taxa geral de erro do Tipo I. Leitores interessados devem consultar Cabral17 para saber mais
detalhes.
A Figura 12-28 mostra pesos médios ao nascer junto com intervalos de confiança de 95% para
pesos médios ao nascer em cada grupo racial/étnico. Neste exemplo, todos os intervalos de
confiança se sobrepõem, então, não podemos tirar nenhuma conclusão com base unicamente
nos intervalos de confiança dentro do grupo sobre diferenças no nível de pares.
Raça da mãe/Etnia
Uma demonstração ainda melhor dos dados mostrados na Figura 12–28 aparece na Figura 12–
29, que retrata as médias como símbolos (caixas) em vez de barras. Retomando a noção de
Tufte de lixo gráfico e da razão dados para tinta (e a meta de maximizar essa razão).2 Mostrar
médias usando gráficos de barras pode ser visto como uso excessivo de tinta. Na Figura 12–29,
removemos a "tinta" extra contida nas barras e também tornamos os níveis de confiança mais
visíveis para facilitar as comparações adequadas.
FIGURA 12–29 Médias e intervalos de confiança de 95% para
pesos ao nascer por raça/etnia
Grupo de tratamento
Suponha que no estudo descrito no Exemplo 12.4 também tenhamos medido diversas
complicações na gravidez, como aborto, parto prematuro e diabetes gestacional, e criamos um
indicador composto de qualquer complicação (uma variável dicotômica). A Figura 12-31 mostra
as proporções de mães com complicações, junto com intervalos de confiança de 95% para as
proporções em cada grupo racial/étnico.
Raça da mãe/Etnia
Raça da mãe/Etnia
Considere outra vez o Exemplo 12.4 e suponha que queiramos comparar os pesos ao nascer
por sexo da criança e por grupo racial/étnico. A Figura 12-33 demonstra os pesos médios ao
nascer junto com intervalos de confiança de 95% para meninos e meninas por grupo racial/étnico.
(Observe o redimensionamento do eixo y.)
FIGURA 12–33 Médias e intervalos de confiança de 95% para peso
médio ao nascer por raça/etnia e sexo da criança
Dias em tratamento
FIGURA 12–43 Regressão da resposta em dias em tratamento (amostra
total)
Reposta
Dias em tratamento
Dias em tratamento
Feminino Masculino
Dias em tratamento
Feminino Masculino Linear Linear
(Mulher) (Homem)
Considere os dados mostrados na Figura 12–46 com base em uma amostra pequena de n = 9
participantes. Presumindo que todas as medidas estejam corretas (e nenhuma seja um erro de
entrada de dados), a observação no canto inferior direito parece ser um valor atípico – chamado
de ponto de influência. Ele desvia das observações remanescentes, de modo que, quando
colocamos uma linha de regressão, esse ponto puxa a linha de regressão para baixo. A equação
de regressão estimada é 𝑦𝑦� = 26,83 − 0,66x conforme indicado na Figura 12–47. Sem essa
observação (e não devemos nunca remover uma observação!), a equação de regressão é 𝑦𝑦� =
23,50 − 0,27x com base em n = 8 observações.
FIGURA 12–46 Gráfico de dispersão com um ponto de influência
Variável dependente
Variável independente
Variável independente
Um gráfico de dispersão é uma ferramenta útil para examinar associações e para, às vezes,
identificar observações extremas, relativas aos outros. Precisamos estar cientes das
observações influentes, principalmente quando a amostra é pequena. As Figuras 12–46 e 12–47
sugerem que podemos precisar de mais dados ou de uma amostra maior para explorar toda a
distribuição de valores.
Gráficos de pizza são um tipo popular de exibição gráfica, mas, em geral, não recomendamos
seu uso porque podem ser bastante difíceis de interpretar. Os gráficos de pizza foram feitos para
representar graficamente os vários componentes de um todo (p. ex., o percentual de distribuição
de uma categoria única ou variável ordinal). Infelizmente, pode ser difícil para os leitores e
consumidores diferenciar, com precisão, os tamanhos dos segmentos que compõem o gráfico
de pizza, ou comparar precisamente os segmentos entre gráficos de pizza. Embora existam
técnicas para promover a interpretabilidade (p. ex., organizar os segmentos de componente por
tamanho), uma tabela ou uma exibição gráfica diferente pode ser mais eficiente.
Considere, por exemplo, os dados resumidos na Figura 12–54, que estão disponíveis on-line
(http://budget.data.cityofboston.gov/#/) para cidadãos interessados; eles detalham o ano fiscal
2017 do orçamento de capital de Boston (isto é, os gastos planejados da cidade em infraestrutura
e projetos de melhoria). Esses dados estão resumidos na Tabela 12–17 e também na Figura
12–55. Qual formato torna mais fácil comparar investimentos em categorias de orçamento?
FIGURA 12–54 Orçamento de capital para a cidade de Boston no ano fiscal de 2017 –
usando um gráfico de pizza
Saúde e serviços
humanos - US$47,4 M
Desenvolvimento
Informação e tecnologia - econômico - US$19,1 M
US$ 89,4 M
Operações - Habitação e
US$ 90,3 M desenvolvimento da
vizinhança - US$5,7 M
Segurança pública -
US$150,6 M
Gabinete do
Prefeito - US$47,4
Artes e cultura -
US$168,3 M
Ruas - US$775,6 M