You are on page 1of 6

CIÊNCIAS DA SAÚDE

PESQUISA
ESTE É O TÍTULO
SUBTÍTULO

ANOVA: TESTANDO AS DIFERENÇAS ENTRE MÉDIAS


DE TRÊS OU MAIS GRUPOS INDEPENDENTES
Annie Pezalla, PhD
Core Faculty, The Richard W. Riley College of Education and Leadership
Walden University
Janeiro 2018

Visão geral
Os estudos de pesquisa frequentemente comparam grupos de pessoas em função do resultado de
variáveis de interesse. Algumas vezes, estes estudos envolvem apenas dois grupos de pessoas, caso em
que um teste t é o ideal para isso. Porém boa parte dos estudos costuma envolver mais de dois grupos.
Que tipo de teste estatístico seria adequado para examinar as diferenças entre médias de mais de dois
grupos? A ANOVA, ou Análise de variância, seria uma boa escolha nesse cenário. Com a ANOVA, o
objetivo é examinar se existem diferenças entre médias de dois ou mais grupos.

Por exemplo, imagine que você queira determinar se quatro grupos culturais diferentes — índios
americanos que vivem em uma reserva, residentes legais da região central da cidade, residentes legais
do subúrbio e residentes sem documentação (ilegais) — apresentam comportamentos diferentes em
relação aos idosos.

Algumas observações:
- Este exemplo utiliza uma ANOVA de um fator (one-way ANOVA), que é uma análise estatística útil
para desenhos de pesquisa que envolvam apenas uma variável de agrupamento independente1 e
uma única variável dependente contínua2.

- Em uma ANOVA, assim como em um teste t, uma categoria corresponde a um grupo de casos ou
indivíduos. No cenário usado como exemplo, a variável independente possui quatro categorias:
índios americanos, região central da cidade, subúrbio e ilegais. Se houver apenas duas categorias,
um teste t provavelmente seria uma abordagem mais simples. ANOVAs de um fator normalmente
são usadas quando há mais de duas categorias .

1
A variável de agrupamento independente é algumas vezes chamada de variável de atributo independente devido ao
fato de você estar dividindo o grupo com base em uma caracteristica específica que ele possua (por exemplo, no nosso
caso, esta variável independente seria o grupo cultural. Outras variáveis de agrupamento independente poderiam ser o
grau de instrução, a cor dos olhos, a raça, o partido político ou a localização geográfica).
2
Uma variável dependente contínua também é chamada de variável de resultado e em uma ANOVA, ela deve ser
contínua, o que significa que pode assumir qualquer valor entre um mínimo e máximo.

1
© 2017 Laureate International Universities ®
PESQUISA
ANOVA: TESTANDO AS DIFERENÇAS ENTRE MÉDIAS DE TRÊS OU MAIS GRUPOS INDEPENDENTES

- Embora a variável independente em uma ANOVA tecnicamente possa ser categórica ou contínua, os
pesquisadores costumam usá-la nos casos em que não há um número muito grande de categorias. Quando há
categorias demais, pode haver muito poucos participantes em cada uma e provavelmente o teste não terá poder
estatístico suficiente para discriminar diferenças entre os grupos. Por esta razão, a ANOVA de um fator
normalmente é aplicada quando a variável independente tem relativamente poucas categorias e, na maior parte
dos casos é categórica.

As cinco etapas básicas de um teste de hipóteses devem ser seguidas para se realizar a ANOVA. Analisaremos
cada uma delas a seguir.

1. Avalie se as premissas são válidas


Esta é uma etapa importante e muitas vezes ignorada devido a ansiedade para iniciar as análises. Recomendamos
que você não ignore esta etapa! Reserve um tempo para fazer uma análise descritiva de seus dados. Analise a
média da variável dependente para cada grupo da sua amostra. Observe o tamanho de cada grupo, a média e o
desvio-padrão de cada um. Veja na Tabela 1 um exemplo disso .

Tabela 1
Estatísticas descritivas por grupo cultural

Grupo cultural Média N Desvio- padrão


Índios americanos 53,8180 25 8,59169
Região central da cidade 58,6210 25 10,93985
Subúrbio 62,7753 25 9,81548
Ilegais 68,5096 25 11,69701
Total 60,9310 100 11,52910

Você também pode visualizar este resultado por meio de um diagrama boxplot 3. Caso você queira obter um
tutorial dessa etapa preliminar, use termos de busca como “realizar estatísticas descritivas para um teste
ANOVA“one way”” em qualquer mecanismo de busca. Especifique se está usando SPSS, Excel, R ou qualquer
outro software estatístico para o seu trabalho de análise.

Ao examinar os dados, será possível determinar se as premissas necessárias para uma ANOVA foram
cumpridas. Estas suposições incluem as hipóteses de normalidade e de homogeneidade de variância.
Essencialmente, isso significa que, para interpretar satisfatoriamente os resultados de uma ANOVA, os valores
observados nas variáveis de medida devem ser normalmente distribuídos (curva em forma de sino) e apresentar
variâncias de mesma magnitude (o “peso” das caudas das curvas devem ser similares). Se essas premissas não
forem cumpridas, a aplicação da ANOVA não é adequada para comparar médias de grupos, e um teste não
paramétrico será preferível, como o teste de Kruskal-Wallis.

3
Boxplot: Método para descrever graficamente grupos de dados numéricos por meio de seus quartis. Os boxplots também
podem apresentar linhas que se estendem verticalmente para fora das caixas (bigodes) indicando a presença de
observações fora dos quartis superiores e inferiores; daí os termos box-and-whisker plot [gráfico de caixa e bigode] e box-
and-whisker diagram [diagrama de caixa e bigode]. Os valores atípicos (outliers) podem ser representados como pontos
individuais.

2
© 2017 Laureate International Universities ®
PESQUISA
ANOVA: TESTANDO AS DIFERENÇAS ENTRE MÉDIAS DE TRÊS OU MAIS GRUPOS INDEPENDENTES

Para avaliar a validade dos pressupostos de normalidade e de homogeneidade da variância, realize testes de
hipóteses no seu programa estatístico. Na realização desses testes, você vai buscar por resultados não
significativos. Ou seja, os seus resultados devem corresponder a p-values maiores que 0,05 ou qualquer que
seja o seu nível alfa4. Se os resultados não
forem significativos significa que você pode assumir que os seus dados não infringem os pressupostos investigados.

2. Defina as perguntas a serem testadas , as hipóteses e o alfa.


Nesta ANOVA, você testaria a seguinte hipótese nula:
𝐻0 : 𝜇𝐴𝑚𝑒𝑟𝑖𝑐𝑛𝑎 𝐼𝑛𝑑𝑖𝑎𝑛𝑠 = 𝜇𝑖𝑛𝑛𝑒𝑟 𝑐𝑖𝑡𝑦 = 𝜇𝑠𝑢𝑏𝑢𝑟𝑏𝑎𝑛 = 𝜇𝑢𝑛𝑑𝑜𝑐𝑢𝑚𝑒𝑛𝑡𝑒𝑑

A hipótese nula declara que as quatro populações apresentam , em média, o mesmo comportamento em relação aos idosos.
A hipótese alternativa seria:
𝐻𝐴 : 𝑛𝑜𝑡 𝐻0

A hipótese alternativa declara que uma ou mais das médias de população difere das demais — ou seja, que as
quatro populações não possuem o mesmo comportamento em relação aos idosos.

3. Selecione a distribuição da amostra e especifique a estatística de teste.


Na ANOVA de um fator, você precisa usar um teste F para examinar se existem diferenças entre as médias de dois
ou mais grupos. A estatística F pode ser vista como a relação da variância entre grupos e intra grupos, e é
determinada por esta fórmula:

F = quadrado médio entre os grupos / quadrado médio intra grupos

Uma estatística F maior significa que existe mais variância entre os grupos do que variância dentro de cada grupo,
aumentando a chance de rejeição da nossa hipótese nula.

A estatística F também requer que você calcule o número de graus de liberdade. Você precisa calcular dois graus
de liberdade: entre os grupos e dentro dos grupos. Para a soma de quadrados entre os grupos, os graus de
liberdade são determinados por:

Dfb = k – 1

Onde k é o número de grupos.

Para a soma de quadrados intra grupos, os graus de liberdade são determinados por:

Dfw = N – k

Onde N = o número total de casos e k = o número total de amostras.

4
Nível alfa: o alfa é a probabilidade na qual você rejeita a sua hipótese nula. Para este exemplo, o padrão é definir o alfa em
0,05. Isso significa, basicamente, que existe uma probabilidade de apenas 5% de você interpretar um resultado como
significativo quando, de fato, ele simplesmente ocorreu por acaso.

3
© 2017 Laureate International Universities ®
PESQUISA
ANOVA: TESTANDO AS DIFERENÇAS ENTRE MÉDIAS DE TRÊS OU MAIS GRUPOS INDEPENDENTES

4. Computar a estatística de teste.


Diversos programas estatísticos computam esses valores para você. Abra qualquer mecanismo de pesquisa, como
o Google, e digite “executar teste F no SPSS/Excel/R”, e você vai encontrar diversos tutoriais sobre como calcular
estatísticas usando o software mais acessível ou adequado para suas necessidades. Segue abaixo o resultado
desse teste em SPSS. (Observação: os dados usados para esta análise não são reais.)

ANOVA
Dependente

Soma dos quadrados df Quadrado médio F Sig.

Entre os grupos 2.919,216 3 973,072 9,123 0,000

Dentre grupos 10.239,868 96 106,665


Total 13.159,084 99

Observe a estatística F de 9,1. Observe também os graus de liberdade. Para o nosso exemplo, os graus de
liberdade são os seguintes:

Dfb = Número total de grupos – 1  (4 – 1) = 3


Dfw = Número total de participantes – número total de grupos  (100 – 4) = 96

Os graus de liberdade entre os grupos é 3; os graus de liberdade dentro dos grupos é 96.

O que o SPPS chama de Sig é o que normalmente é denominado como o p-value. Pergunta: Se o alfa é igual a
0,05, devemos manter ou rejeitar a hipótese nula? Você rejeitaria a hipótese nula, diante dos resultados abaixo?

F(3.96) = 9,123, p = 0,001.

Você pode concluir com segurança que as médias de sua variável dependente são diferentes. Porém, você ainda
não sabe quais grupos são diferentes e como eles são diferentes. E como descobrir quais médias são diferentes
entre si? Esta é a próxima etapa no processo. Você precisa executar e interpretar seu(s) teste(s) post-hoc.

5. Interprete os resultados.
Para determinar quais dos seus grupos em uma ANOVA são significativamente diferentes, uma abordagem
tentadora, mas não recomendada, é conduzir os testes t envolvendo cada possível par de médias com o uso de
uma probabilidade alfa de 0,05. Em geral, você realizaria um teste t comparando os grupos 1 e 2, 1 e 3, 1 e 4, 2 e
3, 2 e 4, e 3 e 4. O problema de fazer múltiplos testes t é controlar a probabilidade de um erro tipo I. Com seis
testes de hipóteses independentes e alfa igual a 0,05 para cada teste individual, a probabilidade conjunta de um
ou mais erros tipo I para os seis testes é de aproximadamente 0,26. Por esta razão, se a média das quatro
populações são iguais, a probabilidade de pelo menos duas das médias serem diferentes umas das outras é de
aproximadamente um em quatro — certamente muito maior do que um em vinte, como seria o caso para um
nível alfa de 0,05.

Para evitar a superestimação da probabilidade de um erro tipo I, existem diversas abordagens que podem ser
utilizadas após um teste F se mostrar significativo. São chamados de testes post-hoc. As análises post-hoc são
examinadas somente se for constatado que o teste F inicial para uma ANOVA de um fator é estatisticamente
significativo (isto é, se a hipótese nula for rejeitada). A abordagem de Bonferroni e o Teste de diferença
honestamente significativa (Honestly Significant Difference – HSD) de Tukey são habitualmente usados em testes

4
© 2017 Laureate International Universities ®
PESQUISA
ANOVA: TESTANDO AS DIFERENÇAS ENTRE MÉDIAS DE TRÊS OU MAIS GRUPOS INDEPENDENTES

post-hoc. Esses testes variam em poder estatístico e consideram pressupostos diferentes. Para obter mais
informações sobre esses testes, use qualquer mecanismo de busca para encontrar informações sobre “testes
post-hoc Bonferroni versus Tukey”.

Tabela de comparações múltiplas


Variável dependente: Dependente

Diferença Erro- Intervalo de confiança de 95%

(I) Cultura (J) Cultura média (I-J) padrão Sig. Limite inferior Limite superior

HSD de Índios Região central da


-4,80308 2,92117 0,359 -12,4408 2,8346
Tukey americanos cidade

Subúrbio -8,95739* 2,92117 0,015 -16,5951 -1,3197

Ilegais -14,69168* 2,92117 0,000 -22,3294 -7,0540


Região central da Índios americanos 4,80308 2,92117 0,359 -2,8346 12,4408
cidade Subúrbio -4,15431 2,92117 0,489 -11,7920 3,4834

Ilegais -9,88860* 2,92117 0,006 -17,5263 -2,2509

Subúrbio Índios americanos 8,95739* 2,92117 0,015 1,3197 16,5951

Região central da
4,15431 2,92117 0,489 -3,4834 11,7920
cidade

Ilegais -5,73429 2,92117 0,209 -13,3720 1,9034

Ilegais Índios americanos 14,69168* 2,92117 0,000 7,0540 22,3294

Região central da
9,88860* 2,92117 0,006 2,2509 17,5263
cidade

Subúrbio 5,73429 2,92117 0,209 -1,9034 13,3720


* = A diferença média é significativa no nível 0,05.

Para interpretar os resultados na Tabela de comparações múltiplas, analise primeiro o número -4,80308 acima.
Esta é a diferença nas médias entre as amostras de Índios americanos e a amostra de Residentes da região
central da cidade (lembre-se de que os dados são fictícios e somente podem ser usados para ilustrar um
resultado estatístico). Para verificar o cálculo, subtraia 58,6210, a média da amostra de Residentes da região
central da cidade, de 53,8180, a média de Índios americanos (veja a Tabela 1). Observe que o resultado é
negativo porque a média do comportamento em relação aos idosos entre os indivíduos da Região central da
cidade é maior que a média entre os Índios americanos.

Agora analise o número 0,359 na Tabela de comparações múltiplas. Este valor é o p-value para a comparação
individual, e não é significativo. Por esta razão, a decisão a partir da primeira linha é manter a hipótese nula de
que a média populacional para os grupos de Índios americanos e de Residentes da região central da cidade é
igual; isto é, você não rejeitaria a hipótese nula, nem tem evidências de que as médias desses dois grupos sejam
diferentes umas das outras. Em termos de comparação com outros grupos, os grupos de Índios americanos e
Residentes do subúrbio mostram diferenças estatisticamente significativas (p = 0,015) em suas atitudes para
com os idosos, e os indivíduos ilegais apresentam melhor comportamento (p = 0,015) do que os Índios
americanos.

5
© 2017 Laureate International Universities ®
PESQUISA
ANOVA: TESTANDO AS DIFERENÇAS ENTRE MÉDIAS DE TRÊS OU MAIS GRUPOS INDEPENDENTES

Resumo
Ao considerar a realização ou não de uma ANOVA de um fator em seu estudo, considere primeiro o seu
objetivo de pesquisa. Se você deseja determinar as diferenças entre médias de vários grupos de casos, uma
ANOVA de um fator pode ser apropriada. Ao realizá-la, você vai querer primeiro verificar se o teste F para a
ANOVA é estatisticamente significativo. Caso o teste F seja, de fato, significativo, você vai examinar os
resultados das suas análises post-hoc para verificar quais médias são diferentes umas das outras. Há muitos
tipos diferentes de análises post-hoc e você pode se aprofundar sobre essas abordagens para determinar a(s)
que melhor se encaixa(m) no seu problema.

6
© 2017 Laureate International Universities ®

You might also like