You are on page 1of 163

Estatistica e Bioestatstica

2014

Estatistica e Bioestatstica
Teoria e exercicios passo-a-passo

Este livro apresenta as estatisticas paramtricas e no-


paramtricas passo-a-passo; critrios de deciso para verificao
de hipoteses. Pretende-se com esta compilao de testes e teorias,
capacitar o leitor para a aplicao estatstica investigao em
cincias da sade, sociais, mdicas, psicolgicas e biolgicas

Margarida Pocinho
12-11-2014

1
Estatistica e Bioestatstica
2014

ndice Geral

Noes de estatistica..................................................................................................................................... 5
1.2 Noes de bioestatistica .......................................................................................................................... 7
1.2.1 - Definio ....................................................................................................................................... 7
2.1 Noes gerais ....................................................................................................................................... 10
2.1.1 Clculo do tamanho mnimo da amostra.......................................................................................... 12
3.1 Amostragens Probabilsticas e No-Probabilsticas............................................................................... 15
3.1.1 As Amostragens Probabilsticas ...................................................................................................... 15
3.1.2 As Amostragens No Probabilsticas: .............................................................................................. 25
3.2 Propriedades da distribuio normal .................................................................................................... 26
4.1 Clculo do Tamanho da Amostra para Populaes Infinitas ................................................................. 31
4.1.1.Proporo ....................................................................................................................................... 31
4.1.2. Determinao da Margem de Erro da Amostra ............................................................................... 35
4.2. Clculo do Tamanho da Amostra para Populaes finitas .................................................................... 36
4.2.1. Proporo ...................................................................................................................................... 36
4.2.2. Mdia............................................................................................................................................ 37
5.1. Indivduo ou Unidade Estatstica .......................................................................................................... 40
5.2 Varivel Estatstica ............................................................................................................................... 40
5.3 Parmetro e dado estatstico ................................................................................................................. 42
5.4 Representao de uma varivel estatstica ............................................................................................. 43
5.5 Reduo de uma varivel estatstica ...................................................................................................... 46
5.5.1 Conceito de reduo e sua convenincia.......................................................................................... 46
6.1 Mdia aritmtica................................................................................................................................... 46
6.2 Mdia Ponderada: ................................................................................................................................ 48
6.3 Mediana ............................................................................................................................................... 49
6.3.1. N mpar: ..................................................................................................................................... 50
6.3.2. N par: ......................................................................................................................................... 50
6.4 Moda ou Norma - Mo............................................................................................................................ 53
6.5 Separatrizes ou Quantis ........................................................................................................................ 54
8.1. Testes paramtricos passo-a-passo....................................................................................................... 83
8.1.1 O que so testes paramtricos? ........................................................................................................ 83
8.1.2 Os parmetros da curva normal. ...................................................................................................... 83
8.1.3 Correlao...................................................................................................................................... 83
8.1.4 Teste t de Student para amostras independentes (no relacionado) ................................................... 89
10.3 Teste t de Student (relacionado) ....................................................................................................... 93
10.4 ANLISE DE VARINCIA ........................................................................................................... 96
8.1. Testes no paramtricos (NP) passo-a-passo ...................................................................................... 104
8.1.1 Teste do qui-quadrado .................................................................................................................. 104

2
Estatistica e Bioestatstica
2014
8.1.1 Testes NP para duas amostras independentes ................................................................................ 107
5.4 Teste U de Mann-Whitney............................................................................................................... 108
8.1.2 Procedimentos para ordenao de resultados ................................................................................. 108
6. Testes para duas amostras relacionadas................................................................................................ 113
6.1 Prova de mcnemar para a significncia de mudanas ........................................................................ 113
6.2 Correco de continuidade............................................................................................................... 116
6.3 Teste dos sinais de Wilcoxon ........................................................................................................... 117
7. Testes para k amostras independentes ................................................................................................... 119
7.1 Teste de Kruskal-Wallis .................................................................................................................. 119
8. Testes para k amostras relacionadas ..................................................................................................... 122
8.1 Prova de Cochran ............................................................................................................................ 123
8.2 Teste de Friedman ........................................................................................................................... 123
9. Medidas de correlao e suas provas de significncia ........................................................................... 126
9.2 O coeficiente de concordncia de Kendall ........................................................................................ 127
10 o SPSS .......................................................................................................................................... 128
Clicar em Analyse/ Nonparametris Tests/ 2 Related Samples... .................. Erro! Marcador no definido.
Wilcoxon Signed Ranks Test...................................................................... Erro! Marcador no definido.
TESTE H DE KRUSKAL-WALLIS: .................................................................. Erro! Marcador no definido.
>Analyse > Nonparametric tests >K independent SAMPLES... ................... Erro! Marcador no definido.
Kruskal-Wallis Test ................................................................................... Erro! Marcador no definido.
Anexos...................................................................................................................................................... 151
Anexo I Tabela do Quiquadrado (x2):Valores crticos ............................................................................ 152
Anexo II - Tabela de U para 0,05........................................................................................................... 153
Anexo III Tabela de Wilcoxon Valores crticos: .................................................................................... 157
Anexo IV - Tabela H - n<5.................................................................................................................... 158
Anexo V - Tabelas A a D (Tabelas de Friedman) ................................................................................... 159
Anexo VI - rho de spearman.................................................................................................................. 160
Anexo VII Tabela E- Valores crticos da distribuio de Chi- Quadrado ................................................ 161
Anexo VIII - Valores Crticos para a anlise de varincia por nmero de ordem de Friedman ................. 162

3
Estatistica e Bioestatstica
2014

ndice de Figuras
FIGURA 1:FLUXO DA IMPORTANCIA E CONTRIBUTO DA ESTATISTICA. ...................................................................................... 7
FIGURA 2:POPULAO E AMOSTRA ..................................................................................................................................... 10
FIGURA 3:POPULAO E AMOSTRA ..................................................................................................................................... 15
FIGURA 4: AMOSTRA ESTRATIFICADA ................................................................................................................................. 20
FIGURA 5: AMOSTRA ESTRATIFICADA PROPORCIONAL .......................................................................................................... 21
FIGURA 6: AMOSTRA ESTRATIFICADA NO PROPORCIONAL ................................................................................................... 22

4
Estatistica e Bioestatstica
2014

Introduo

Desde sculos o homem tem, muitas vezes, tomado notas de coisas e de pessoas, no com o nico fim de
acumular nmeros, mas com a esperana de utilizar os dados do passado para a resoluo de problemas do
presente assim como para a previso de acontecimentos futuros. No entanto, o sucesso quanto a este objectivo
s foi possvel em data muito recente: s no final do sculo XIX e, sobretudo, no princpio do sculo XX que,
com a aplicao de probabilidades aos problemas sobre a interpretao dos dados recolhidos, foi possvel
resolver alguns deles.

A Estatstica conquistou, hoje, o seu lugar entre as cincias. O poder do seu mtodo , sobretudo, afirmado nas
ltimas dcadas e aplica-se, agora, nos domnios mais variados. At aqui, s um pequeno nmero de pessoas se
preocupou com estudos estatsticos, quer pela natureza das suas investigaes, quer por causa da sua utilidade
para as diferentes profisses. O valor e a importncia do mtodo estatstico residem no esforo para melhor
compreender o nosso mundo, to maravilhosamente complexo, tanto no ponto de vista fsico como social,
levam-nos a sonhar que ele se torne objecto de um conhecimento como as outras cincias. A vida corrente leva-
nos a decises para passar do conhecido ao desconhecido, da experincia previso.

Este manual tem por fim fornecer conhecimentos estatsticos (sem ter muitos conhecimentos matemticos) e
ajudar a interpretar os resultados que podem ser obtidos quer atravs do calculo manual, quer atravs de
programas de computador.

1. Noes Gerais

Noes de estatistica

Para algumas pessoas, a Estatstica no seno um quadro de colunas mais ou menos longas de nmeros que
dizem respeito populao, indstria ou ao comrcio, como se v frequentemente em revistas; para outras,
ela d grficos mostrando a variao no tempo de um facto econmico ou social, a produo ou os nmeros
relativos aos negcios de uma empresa, assim como se encontra nos escritrios de empresas privadas.

To diferenciados se apresentam os mtodos estatsticos que no possvel estabelecer uma definio que os
contenha a todos. Apesar disso, apresentamos a seguir uma definio que, embora necessariamente incompleta
como qualquer outra, tem a vantagem de introduzir o aluno na matria.

A Estatstica tem como finalidade elaborar de uma sntese numrica que evidencie o que de mais generalizado e
significativo exista num conjunto numeroso de observaes. O grande nmero de observaes de que se parte
reflecte uma diversidade tal que se torna ininteligvel a sua interpretao. Para que, a partir dessa diversidade
se possa comear a entender logo, torna-se necessrio reduzir sucessivamente as observaes, ganhando-se em
generalidade o que se vai perdendo em individualidade.

A sntese implica, assim, que nos desprendamos do que particular e individual para nos atermos ao que existe
de mais geral no conjunto das observaes; medida que a sntese progride, vai-se perdendo o contacto com as
particularidades imediatas.

Deste modo, a Estatstica no se ocupa do que excepcional, mas apenas do que geral: no se interessa pelo
indivduo, mas por grupos de indivduos; no se ocupa, em suma, de uma s medio, mas de um conjunto de

5
Estatistica e Bioestatstica
2014
medies. Acrescente-se, ainda, que a sntese numrica. Quer isto dizer que se prescinde inteiramente das
palavras e dos recursos literrios de mais ou menos efeito que elas possibilitam. Alcana-se a sntese pelo
recurso exclusivo dos nmeros.

Da o af com que frequentemente se escolhem os nmeros de acordo com os argumentos. A Estatstica


intrinsecamente uma disciplina no literria, manipula exclusivamente nmeros e alcana a sntese ordenando-
os e cooperando com eles.

Estatstica, deriva de status que em latim significa Estado, e que s por si demonstra a ligao que sempre
existiu entre ambos. O primeiro levantamento estatstico remonta a 3050 a.C., no Egipto, tendo como objectivo
informar o estado sobre recursos humanos e econmicos. No sc. XVII d.C., a disciplina de Estatstica era j
leccionada nas universidades alems, continuando com a finalidade de descrever as populaes e as riquezas
do Estado. Ainda no sc. XVII, d-se a expanso dos seus campos de investigao a reas como a Sade
pblica; a Indstria; o Comrcio e os Estudos Demogrficos.

Os mtodos de inferncia estatstica surgem com Jonh Graunt (1620-1674), um modesto comerciante, que tira
concluses vlidas sobre uma populao desconhecida por ele.

Fermat (1601-1665) e Pascal (1623-1662) permitem que o estudo do acaso tome uma expresso matemtica,
introduzindo o Clculo das Probabilidades. Esta expresso matemtica e o aparecimento do mtodo dos
mnimos quadrados, vm credibilizar a Estatstica conferindo-lhe a fundamentao matemtica em que ela,
hoje, assenta.

No sc. XVIII Lambert Quetelet (1796-1874) introduziu a Estatstica nas anlises da Meteorologia; da
Antropometria; das Cincias Sociais; da Economia e da Biologia.

Aos contributos anteriores Francis Galton (1822-1911), acrescenta as noes de regresso e correlao; Karl
Pearson (1857-1936) apresenta a mais bela e acabada teoria de Estatstica, ficando tambm conhecido pelos
seus coeficientes (r; c); Fisher com os seus trabalhos sobre inferncia Estatstica tambm deu um grande
contributo ao desenvolvimento da Estatstica.

Em 1943, d-se uma grande reviravolta, uma vez que o tratamento de dados deixa de ser feito manualmente e
passa, numa primeira fase, a ser apoiado por calculadoras potentes para mais tarde ser computadorizado.

O Mtodo Estatstico, segundo a teoria de Cramer, pressupe as seguintes fases:

Recolha de dados estatsticos: obteno da amostra a partir da populao, devendo depurar e rectificar os
dados estatsticos, que no seu conjunto so denominados srie estatstica.
Descrio: conjunto de operaes, numricas ou grficas, efectuadas sobre os dados estatsticos determinando
a sua distribuio; procede-se sua ordenao, codificao e representao por meio de quadros e tabelas.
Anlise: consiste em tirar concluses sobre a distribuio da populao, determinar o seu grau de confiana e
ainda formular hipteses, tentando verific-las, quanto ao fenmeno em estudo.
Predio: uma previso do comportamento do fenmeno em estudo, tendo em conta a definio da
distribuio estatstica.

Em termos gerais, parece-nos que uma boa definio do que a estatstica, j que resume os conceitos dos
vrios autores, :

Cincia que trata do planeamento, colheita, organizao, sintetizao, apresentao e anlise de dados, bem
como, a obteno de concluses vlidas e tomada de decises em diversos campos do saber (engenharias,
sade, biologia, farmcia, biofsica, ciencias sociais, geografia, etc.).

Com efeito, o papel da Estatstica na pesquisa cientfica apoiar o investigador na formulao das hipteses
estatsticas e fixao das regras de deciso, no fornecimento de tcnicas para um eficiente plano de
investigao, na colheita, tabulao e anlise dos dados (estatstica descritiva) e em fornecer testes de

6
Estatistica e Bioestatstica
2014
hipteses a serem realizados de tal modo que a incerteza da inferncia possa ser expressa em um nvel
probabilstico pr-fixado (inferncia estatstica) cujo valor mximo de erro mais consensual de 5%. (fig 1)

FIGURA 1:FLUXO DA IMPORTANCIA E CONTRIBUTO DA ESTATISTICA.

1.2 Noes de bioestatistica

1.2.1 - Definio

Historicamente foram muitas as definies estabelecidas para Estatstica. Da mesma forma, so muitas as
definies para Bioestatstica. Preferimos adotar a seguinte: Conjunto de tcnicas que permite recolher, apurar
e apresentar dados para que sejam analisados, proporcionando inferncias indutivas sobre as cincias da vida.

A m utilizao de dados mdicos ou de outras cincias, com interpretaes errneas ou mal intencionadas, tem
produzido um grande ceticismo em relao estatstica. Podemos encontrar muitos professores, clnicos ou
mesmo profissionais de cincias bsicas, que acham que bom senso" suficiente para tratar desses dados, que
qualquer coisa que exija prova estatstica no pode ter valor prtico ou que procuraro um matemtico se
tiverem algum problema estatstico em seu trabalho.

importante compreender, no entanto, que cada vz que se toma a mdia de duas leituras de exame, por
exemplo, ou o nmero mdio de dias de internamento no hospital de pacientes com determinada doena, se est
a usar um mtodo estatstico. Do mesmo modo, usamos mtodos estatsticos para concluir que a presso
arterial do paciente est normal ou que um tratamento cirrgico melhor que outro. Deste modo, a Estatstica
nas cincias da sade constitui-se realmente nos princpios da Medicina Quantitativa. Muito das cincias da
sade depende, directa ou indirectamente, de contagem ou mensurao. Isto bvio em pesquisa e verdadeiro
tambm no diagnstico. Quando um profissional superior de sade, leva em considerao na avaliao de um
tumor a sua idade e histria familiar, est a utilizar dados quantitativos, ou seja, a incidncia de tumores por
idade e por famlia.

Convencionou-ser chamar de Bioestatstica o conjunto de conceitos e mtodos cientficos usados no tratamento


da variabilidade nas cincias da sade em especial as cincias mdicas e biolgicas. A Bioestatstica fornece
mtodos para se tomar decises timas na presena de incerteza, estabelecendo faixas de confiana para a
eficcia dos tratamentos e verificando a influncia de factores de risco no aparecimento de doenas. Dentro da
rea biolgica, compreende-se por Biometria a cincia que estuda as medidas de seres vivos.

A nfase crescente do papel dos mtodos quantitativos na prtica da medicina torna imperativo que o estudante
de medicina assim como o profissional de sade tenham algum conhecimento de estatstica.

O estudante aprende na escola o melhor mtodo de diagnostico e teraputica; depois de formado depender
necessariamente de trabalhos apresentados em reunies, jornais e revistas cientificas, para aprender novos
mtodos de terapia, assim como os progressos em diagnostico e tcnicas. Portanto, dever :

7
Estatistica e Bioestatstica
2014
estar apto a avaliar por si prprio os resultados de outros pesquisadores, dever decidir quando uma nova
tcnica ou mtodo pode substituir os antigos.
estar apto a dar famlia do paciente, ou ao prprio, bem como aos seus colegas de trabalho, segurana
quanto ao diagnstico, o que pode depender de sua capacidade de avaliar adequadamente os resultados de
exames laboratoriais e outros, como tambm de seu conhecimento sobre a relao entre a idade, sexo e outras
condies do paciente e uma determinada doena. Os novos conhecimentos viro atravs do trabalho de
pesquisa realizado por ele prprio ou por outros.
ser capaz de seleccionar, da massa de informaes, aquelas que forem vlidas e que resistirem a testes
cientficos rgidos.
desenvolver um ceticismo sadio em relao a tudo que l. Uma noo bsica o reconhecimento de que os
indivduos diferem no apenas uns dos outros, mas tambm em relao a si prprios, de dia para dia ou mesmo
de hora para hora. Uma certa quantidade de variao normal, mas a questo que desafia o profissional de
sade determinar quando uma variao especfica se torna patolgica (referente doena).

Para isso, o estudante deve aprender como medir a variao em indivduos normais e definir qual o limite de
variao normal. Deve aprender que h algum erro aleatrio presente em cada medida ou contagem feita.
altamente improvvel que duas contagens sucessivas de glbulos, feitas na mesma amostra de sangue, sejam
idnticas. Quando, porm, uma diferena se torna maior que o erro de mensurao? Para exercer as suas
funes do melhor modo possvel, o profissional de sade deve saber responder a questes como essa. Para
cada medida ou determinao fornecida pelo laboratrio, o profissional de sade deve conhecer a variao que
parte do prprio mtodo, para saber quando uma dada variao representa uma mudana real no paciente.
Sempre que novos mtodos de terapia so introduzidos, necessrio saber se so realmente superiores, isto ,
mais eficientes que os velhos mtodos. Ser nacessrio fazer-se a avaliao crtica do estudo experimental,
verificando principalmente se as medidas foram realizadas de modo a produzir resultados fidedignos, se o
factor em prova foi o nico factor de diferena entre o grupo experimental e o grupo controle, se a diferena
entre os resultados obtidos nos dois grupos foi maior que aquela que poderia ser atribuda ao acaso. Apenas
depois da avaliao, atravs de tcnicas estatsticas adequadas, da fidedignidade dos resultados,
comparabilidade dos grupos experincia e controle e, significncia da diferena encontrada que podemos
tirar as concluses relativas ao novo mtodo.

O nmero de falhas encontradas em publicaes mdicas enfatiza a necessidade de uma avaliao crtica da
literatura. Para ajudar o estudante a desenvolver tal atitude so necessrios certos conceitos estatsticos
bsicos e uma certa familiaridade com a terminologia mais usada. Os Mtodos estatsticos so essenciais no
estudo de situaes em que as variveis de interesse esto sujeitas, inerentemente, a flutuaes aleatrias. Este
o caso da rea da sade principalmente na Medicina. Mesmo tomando-se um grupo de pacientes homogneos,
observa-se grande variabilidade, por exemplo, no tempo de sobrevida aps um tratamento adequado. Dosagens
de caractersticas hematolgicas flutuam no s entre indivduos, como tambm no mesmo indivduo em
ocasies diferentes. Na realidade, h variaes entre diferentes pacientes para qualquer varivel de interesse
clnico. Portanto, para se estudar problemas clnicos, necessria uma metodologia capaz de tratar a
variabilidade de forma adequada.

Deve-se notar, entretanto, que ao tratar um paciente, o profissional de sade se vale da experincia de eventos
anteriores, vivenciada pessoalmente ou transmitida por outros atravs de livros e artigos. Assim, a Estatstica
pode ser vista como ferramenta de organizao e validao do conhecimento na rea da sade.

inegvel, hoje, que a cincia busca a verdade descrevendo o universo e estabelecendo princpios gerais para
explicar os fenmenos do universo. Para tanto deve valer-se do pensamento cientfico, que se estabelece ao
nvel de uma linguagem terica de conceitos e hipteses. As hipteses precisam ser comprovadas, quando se faz
necessria a utilizao de instrumentos operacionais que explicitaro os procedimentos usados para
observao e mensurao do fenmeno. So as hipteses estatsticas.

A passagem da hiptese terica para a hiptese estatstica poderia ser assim exemplificada: Determinado
investigador estudar a veracidade da hiptese: "Os indivduos gordos comem mais que os indivduos magros".

8
Estatistica e Bioestatstica
2014
Esta hiptese encerra alguns conceitos, como: gordo, magro e comer mais. Qualquer que seja o entendimento
destes conceitos tericos, para se operacionalizar a comprovao desta hiptese o investigador dever
estabelecer a maneira de medir gordo, magro e comer mais. Ou seja, como observar e medir gordo, magro e
comer mais? Uma traduo operacional destes conceitos pode ser de que gordo o indivduo que apresente
peso acima da faixa de normalidade no ndice de massa corporal (IMC), e magro o indivduo que apresente
peso abaixo dessa faixa. Comer mais seria traduzido como consumir mais calorias do que o definido como
necessrio pela tabela de ingesto diria de calorias de acordo com o perfil de atividades do indivduo.

Desta forma, a hiptese cientfica poderia ser enunciada como uma hiptese estatstica da seguinte forma: "Os
indivduos que apresentam peso acima da faixa de normalidade do IMC, ingerem mais calorias (medidas pela
tabela de ingesto diria), do que os indivduos que apresentam peso abaixo da faixa de normalidade do IMC".
Se esta hiptese referir-se a poucos indivduos basta verificar se verdade para estes indivduos e a questo
estar resolvida. No entanto, para a cincia no ter muita utilidade tal observao.

Em cincia buscam-se hipteses mais gerais, referentes a parmetros populacionais. Para tanto, sero
elaborados planos de coleta e anlise de dados que testaro a hiptese. Os dados sero colhidos e analisados
atravs de tcnicas estatsticas adequadas e, atravs de uma inferncia indutiva, aceita-se a veracidade ou
falsidade da hiptese estatstica e, conseqentemente, de sua hiptese cientfica correspondente.
Esquematicamente:

Observa-se determinado fenmeno e elabora-se uma hiptese cientfica que procura estabelecer a relao entre
seres e atributos;
A partir da hiptese cientfica se deduz (inferncia dedutiva) uma hiptese estatstica que permita explicar o
fenmeno observado dentro de uma estrutura universal e coerente, incorporada ao conjunto de conhecimentos
actuais;
Com a hiptese estatstica se deduzem (inferncia dedutiva) as conseqncias lgicas quanto ao que deve ser
esperado empiricamente com relao populao;
So estabelecidas as regras de deciso para aceitao ou no aceitao da hiptese;
A hiptese ser verificada quanto a sua veracidade ou falsidade atravs do estudo do comportamento do
fenmeno, com colheita de dados e anlise dos resultados atravs de tcnicas estatsticas adequadas definidas
previamente;
De acordo com o definido como regra de deciso, induz-se (inferncia indutiva), a partir dos resultados e com
base na teoria das probabilidades, a veracidade ou falsidade da hiptese estatstica e a veracidade cientfica
correspondente.

A inferncia indutiva ter tanto mais significado quanto mais rigoroso for o delineamento da colheita de dados
e quanto mais apropriada for a anlise estatstica destes dados. As falhas nestas fases podem implicar em que
os valores encontrados no reflitam adequadamente os parmetros correspondentes. A inferncia da hiptese
estatstica para a cientfica ser tanto melhor quanto mais adequada tenha sido a formulao dos conceitos
tericos.

Uma concluso indutiva bem confirmada provisoriamente aceita como verdade, tornando-se um princpio.
Ser ajustada com a aquisio de novos conhecimentos, somando experincias que a regulem, e permitindo o
contnuo ajuste do modelo realidade do universo.

Ao verificar a provvel verdade de uma hiptese, a Estatstica fornece, em bases probabilsticas, o risco de
errar ao aceitar ou rejeitar uma hiptese. Constitui-se em um instrumento dos mais poderosos para o
pesquisador na busca da verdade, e o principal instrumento para generalizar concluses a partir de
experimentos particulares.

9
Estatistica e Bioestatstica
2014
2. Populao e Amostra

2.1 Noes gerais


Populao: somatrio dos indivduos ou elementos, com qualquer caracterstica comum e que esto sujeitos a
uma anlise estatstica, por terem interesse para o estudo. Quanto sua origem pode ser: um conjunto de
pessoas; um conjunto de objectos ou um conjunto de acontecimentos. Quanto sua natureza pode ser:
Existente ou real; Hipottica ou parcialmente existente. Pode ainda ser: um conjunto finito ou um conjunto
infinito.

Amostra: um subconjunto retirado da populao, que se supe ser representativo de todas as caractersticas
da mesma, sobre o qual ser feito o estudo, com o objectivo de serem tiradas concluses vlidas sobre a
populao.

Amostragem: o procedimento pelo qual um grupo de pessoas ou um subconjunto de uma populao


escolhido com vista a obter informaes relacionadas com um fenmeno, e de tal forma que a populao inteira
nos interessa esteja representada (fig. 2)

FIGURA 2:POPULAO E AMOSTRA


Parmetro: uma caracterstica numrica da populao, como uma mdia da populao, um desvio padro da
populao, uma proporo da populao e assim por diante.

O Plano de Amostragem serve para descrever a estratgia a utilizar para seleccionar a amostra. Este plano
fornece os detalhes sobre a forma de proceder relativamente utilizao de um mtodo de amostragem para
determinado estudo.

Logo que o investigador delimite a populao potencial para o estudo, ele deve precisar os critrios de seleco
dos seus elementos, que podem ser de incluso ou de excluso dos sujeitos que faro parte do estudo:

Uma amostra dita representativa se as suas caractersticas se assemelham o mais possvel s da populao-
alvo. particularmente importante que a amostra represente no s as variveis em estudo, mas tambm outros
factores susceptveis de exercer alguma influncia sobre as variveis estudadas, como a idade, o sexo, a
escolaridade, o rendimento, etc.

A Representatividade avalia-se comparando as mdias da amostra com as da populao-alvo.

Sendo a Populao o conjunto de elementos (pessoas, coisas, objetos) que tm em comum uma caracterstica
em estudo, esta pode ser Finita - quando apresenta um nmero limitado de indivduos (Exemplo: a populao
constituda por todos os pace makers colocados num hospital, num determinado periodo ou o numero de
rastreios auditivos feitos num determinado dia numa unidade de rastreio).

A populao pode ainda ser Infinita: quando o nmero de observaes for a partida indeterminve, como por
exemplo a populao constituda de todos os resultados (cara e coroa) em sucessivos lances de uma moeda).

Sendo a Amostra o conjunto de elementos retirados da populao, suficientemente representativos dessa


mesma populao, estaremos aptos para analisar os resultados como se estudssemos toda a populao. A

10
Estatistica e Bioestatstica
2014
amostra sempre finita, pelo que quanto maior for, mais significativo o estudo. Contudo, como existe sempre
a incerteza de que todas as caractersticas da populao esto presentes numa amostra, j que estas so muitas
vezes desconhecidas, admite-se que existe sempre um grau de erro.

Como preliminar para uma discusso do papel que a teoria desempenhanumapesquisa por amostragem,
interessante descrever sucintamente os estgios envolvidos no planeamento e execuo de uma pesquisa. As
pesquisas variam grandemente na sua complexidade. Extrair uma amostra de um conjunto de 5000 processos
numerados e ordenados num arquivo de uma instituio de ensino superior uma tarefa simples. Muito
diferente a extraco de uma amostra de seropositivos, face quer s vrias disposies ticas como o direito
confidencialidade do seu estado de sade, quer ao medo do preconceito e respectivas consequncias sociais e
profissionais, o que faz com que este tipo de grupos olhe com desconfiana qualquer estranho que comece a
fazer perguntas.

Podemos agrupar as principais fases de uma pesquisa, de forma um tanto arbitrria, nos seguintes 11 tpicos.

Objectivos da pesquisa: devem estar claramente definidos para que todas as decises estejam de acordo com os
mesmos
Populao: a populao a ser submetida a amostragem deve coincidir com a populao sobre quem desejamos
informao (populao alvo).
Dados a serem recolhidos: convm verificar se todos os dados que se pretendem so relevantes para a
finalidade da pesquisa e que nenhum dado essencial seja omisso. H uma tendncia frequente, sobretudo com
populaes humanas, de formular um nmero demasiadamente grande de questes, algumas das quais no
chegam sequer a ser analisadas subsequentemente. Um questionrio muito extenso reduz a qualidade das
respostas, tanto a questes importantes como a questes secundrias.
Grau de preciso desejado: os resultados de pesquisas por amostragem esto sempre sujeitos a certo grau de
incerteza, no s porque se estudou apenas uma parte da populao, mas tambm em decorrncia de erros de
mensurao. Esta incerteza pode ser reduzida aumentando-se o tamanho da amostra e utilizando-se
instrumentos mais precisos de mensurao. O estatstico pode prestar bom auxlio nesta fase.
Mtodo de mensurao: parte importante do trabalho preliminar a construo de formulrios onde se
registaro as perguntas e as respostas. No caso de questionrios simples, as respostas podem s vezes ser pr-
codificadas - isto , registadas de maneira que possam ser transferidas sem dificuldade para uma base de
dados. De facto, para construir bases de dados adequadas, necessrio pr-visualizar a estrutura das tabelas
finais que sero usadas para tirar as concluses pretendidas.
Sistemas de referncia: a construo de uma lista de unidades de amostragem, chamada Sistema de Referncia,
, em geral, um dos principais problemas prticos. Com efeito, antes de seleccionar a amostra, a populao
deve ser dividida em partes, chamadas unidades de amostragem, sendo que estas devem abranger toda a
populao, sem qualquer sobreposio. Isto : cada elemento da populao deve pertencer a uma, e somente
uma, unidade.
Escolha da amostra: h uma variedade de planos para a escolha da amostra. Para cada plano considerado,
podem-se fazer estimativas do tamanho da amostra com base no conhecimento do grau de preciso desejado.
Devem-se comparar os custos relativos e o tempo envolvidos em cada plano antes de se tomar uma deciso.
O pr-teste: deve-se testar sempre o questionrio enquanto o mtodo de recolha de dados, numa amostra
semelhante que vamos utilizar mas em tamanho reduzido. Isto quase sempre resulta em melhoria do
instrumento e pode revelar outros problemas que seriam srios de ultrapassar de outra forma.
Organizao do trabalho de campo: todas as tarefas devem estra previamente definidas em cronograma e em
fases, antecipando desde logo os problemas, muitas vezes de carcter administrativo. de grande valia um
processo para verificao preliminar da qualidade dos resultados, que devem, desde logo prever, a ausncia de
resposta, isto , a falha do entrevistador em obter informaes de determinadas unidades da amostra.
Resumo e anlise dos dados: o primeiro passo a depurao dos dados (ver se existe omisso de respostas,
eliminar dados errneos, m insero de respostas, inconsistncias, etc.). S aps a depurao se precedem aos
clculos que conduzem s estimativas.

11
Estatistica e Bioestatstica
2014
Informao e aprendizagem para futuras pesquisas: quanto mais informaes tivermos inicialmente sobre uma
populao, mais fcil se torna planear uma amostra que d estimativas precisas. Qualquer amostragem
completada , em potncia, um guia para futuras amostragens, melhoradas nos vrios dados que ela fornece
(mdias, desvios padro, natureza da variabilidade das mensuraes principais, o custo da obteno dos dados,
etc.). A prtica da amostragem avana mais rapidamente quando se renem e registam informaes deste tipo.
Relativamente aprendizagem, um facto que um pesquisador arguto aprende a reconhecer erros de execuo
e fazer com que eles no ocorram em pesquisas futuras.
Erro de Amostragem: a diferena que existe entre os resultados obtidos numa amostra e os que teriam sido
obtidos na populao-alvo. Para reduzir ao mnimo o erro amostral deve-se recorrer a duas estratgias:

1. Retirar de forma aleatria e um nmero suficiente de sujeitos que faro parte da amostra.

2. Procurar reproduzir o mais fielmente possvel a populao pela tomada em conta das caractersticas
conhecidas desta.

2.1.1 Clculo do tamanho mnimo da amostra

Apesar da existncia de vrias frmulas, a amostra varia muito de pesquisa para pesquisa. Porm, deve se levar
em conta o tamanho da populao. Todavia, algumas observaes podem ser levadas em consideraes, a
saber:

Tamanho da diferena considerada importante


Quanto menor a diferena maior a amostra
Quanto maior o nmero de elementos numa amostra, menor os desvios dos parmetros em relao ao valor
esperado da populao. Quanto maior a homogeneidade da populao, menor a amostra a ser pesquisada.
Poder desejado para o teste
Probabilidade de que a amostra identifique uma diferena real
Tempo, verbas e pessoal disponveis, dificuldade na obteno dos dados e complexidade do experimento

Os pesquisadores de todo o mundo, na realizao de pesquisas cientficas, em qualquer sector da actividade


humana, utilizam as tcnicas de amostragem no planeamento de seus trabalhos, no s pela impraticabilidade
de poderem observar, numericamente, na sua totalidade determinada populao em estudo, como devido ao
aspecto econmico dessas investigaes, conduzidos com um menor custo operacional, dentro de um menor
tempo, alm de possibilitar maior preciso nos respectivos resultados, ao contrrio, do que ocorre com os
trabalhos realizados pelo processo censitrio (COCHRAN, 1965; CRUZ, 1978).

A tcnica da amostragem, a despeito de sua larga utilizao, ainda necessita de alguma didtica mais adequada
aos pesquisadores principiantes. Na teoria da amostragem, so consideradas duas dimenses:

1) Dimensionamento da Amostra;
2) Composio da Amostra.

2.1.1.1 Procedimentos para determinar o tamanho da amostra


So vrios os procedimentos para determinar o tamnho de uma amostra, contudo deve ter-se em ateno a
seguinte sequencia:

Analisar o questionrio, ou roteiro da entrevista e escolher uma varivel que julgue mais importante para o
estudo. Se possvel mais do que uma;
Verificar o nvel de mensurao da varivel: nominal, ordinal ou intervalar;

12
Estatistica e Bioestatstica
2014
Considerar o tamanho da populao: infinita ou finita

O tamanho da amostra determina-se em funo do nvel de mensurao da varivel escolhida.

So vrias as formulas que permitem calcular o tamanho de uma amostra. A escolha depende do fenmeno em
estudo ou dos paramentros disponveis:

Para os clculos que se seguem escolhemos apenas alguns tipos de formulas com base na simplicidade da sua
notao.

2.1.1.1.1 - Varivel intervalar e populao infinita


Sempre que a varivel mais importante do seu estudo for de nvel intervalar (varivel quantitativa) use a
frmula:

Frmula para populaes infinitas e varivel intervalar


onde: Z = abscissa da curva normal padro, fixado um nvel de confiana (1-)

Z = 1,65 (1 - ) = 90%

Z = 1,96 (1 - ) = 95%

Z = 2,0 (1 - ) = 95.5%

Z = 2,57 (1 - ) = 99%

= desvio padro da populao, expresso na unidade varivel, onde poder ser determinado por:

especificaes tcnicas
com base em valores de estudos semelhantes
conjecturas sobre possveis valores

d = erro amostral, expresso na unidade da varivel. O erro amostral a mxima

diferena que o investigador admite suportar entre e x , isto : x d .

2.1.1.1.2 - Varivel intervalar e populao finita


Quando a varivel de nvel intervalar e a populao considerada finita, determina-se o tamanho da amostra
pela frmula:

Frmula para populaes finitas e varivel intervalar


onde:

Z = abscissa da normal padro

2 = varincia populacional

N = tamanho da populao

d = erro amostral

13
Estatistica e Bioestatstica
2014
2.1.1.1.3 - Varivel qualitativa (nominal ou ordinal) e populao infinita

No caso da varivel de referencia ser nominal ou ordinal, e a populao for considerada infinita, a frmula
pode ser:

Frmula para populaes infinitas e varivel qualitativa


onde: Z = abscissa da normal padro

= estimativa da verdadeira proporo de um dos nveis da varivel escolhida.

Por exemplo, se a varivel escolhida for uma patologia tratada num servio de um hospital, poder ser a
estimativa da verdadeira proporo dessa mesma patologia tratadas em todos os hospitais, nesse mesmo
servio (ficando excludos os hospitais que no tm esse servio).

ser expresso em decimais ( = 30% = 0.30).

d = erro amostral, expresso em decimais. O erro amostral neste caso ser a

mxima diferena que o investigador admite suportar entre e , isto :

| | < , em que a verdadeira proporo (frequncia relativa do evento a ser calculado a partir da
amostra.

2.1.1.1.4 - Varivel qualitativa (nominal ou ordinal) e populao finita


Se a varivel for nominal ou ordinal, mas a populao for considerada finita, determina-se o tamanho da
amostra pela frmula:

Frmula para populaes finitas e varivel qualitativa


onde:

Z = abscissa da normal padro

N = tamanho da populao

= estimativa da proporo.

d = erro amostral

Estas frmulas so bsicas para qualquer tipo de composio da amostra; todavia, existem frmulas especficas
segundo o critrio de composio da amostra.

- Se o investigador escolher mais de uma varivel, poder acontecer de ter que aplicar mais de uma frmula,
assim dever optar pelo maior valor de "n".

Obs.: Quando no tivermos condies de prever o possvel valor para , admita = 0,50 pois, dessa forma,
voc ter o maior tamanho da amostra, admitindo-se constantes os demais elementos.

14
Estatistica e Bioestatstica
2014
3. tipos e Mtodos de Amostragem

3.1 Amostragens Probabilsticas e No-Probabilsticas

A amostragem probabilstica quando cada elemento na populao tem a mesma probabilidade conhecida e
diferente de zero de pertencer amostra. usada alguma forma de sorteio. Permite generalizaes para a
totalidade da populao.

O tipo de amostragem no probabilstica, pode prejudicar a possibilidade de generalizaes (validade externa)


de um estudo, fazendo com que no seja representativo em relao populao. Os seus resultados so vlidos
para aquele estudo determinado, no permitindo generalizaes para outras situaes semelhantes.

Exemplos:

por voluntrios: os elementos amostrais so voluntrios para a pesquisa. Bastante empregada em experimentos
com medicamentos e tcnicas mdicas.
intencional: o pesquisador escolhe os elementos amostrais. Entrevistar os ex-secretrios de sade para
pesquisa de polticas de sade.
por acesso mais fcil: os elementos so escolhidos por estarem mais prximos ou em melhores condies de
acesso. Ex: Aplicar questionrio na populao da zona rural mais prxima do centro.

3.1.1 As Amostragens Probabilsticas


Como j referimos os mtodos de amostragem probabilstica servem para assegurar uma certa preciso na
estimao dos parmetros da populao, reduzindo o erro amostral.

O objectivo desta abordagem obter a melhor representatividade possvel.

Figura 3:populao e amostra

3.1.1.1 Tcnicas de Amostragens Probabilsticas


As tcnicas de amostragem probababilisticas mais comuns entre ns so:

15
Estatistica e Bioestatstica
2014
A Amostragem Aleatria Simples;
A Amostragem Sistemtica.
A Amostragem Aleatria Estratificada;
A Amostragem em Cachos;

3.1.1.1.1 - Amostragem Aleatria Simples


A Amostragem aleatria simples uma tcnica segundo a qual cada um dos elementos (sujeitos) que compe a
populao alvo tem igual probabilidade de ser escolhido para fazer parte de uma amostra. um procedimento
que pode se tornar trabalhoso quando a populao muito grande. aplicado quando a populao
considerada homognea. Para manter essa propriedade deve-se numerar todos os elementos da populao e,
atravs de um sorteio ou do auxlio de uma tabela de nmeros aleatrios, obter os elementos que comporo a
amostra desejada. Por exemplo:

Obter uma amostra representativa, de 10%, de uma populao de 200 alunos de uma escola.

1) Numerar os alunos de 1 a 200;

2) Escrever os nmeros de 1 a 200 em pedaos de papel e coloc-losnumaurna;

3) Retirar 20 pedaos de papel, um a um, da urna, formando a amostra da populao.

Nesta tcnica de amostragem, todos os elementos da populao tm a mesma probabilidade de serem


selecionados: 1/N, onde N o nmero de elementos da populao.

Um outro exemplo recorrer a uma lista com nmeros aleatrios (LNA).

Tabela 1 exemplo 1 de nmeros aleatrios

Os nmeros aleatrios podem ser seleccionados de qualquer lugar da tabela, o importante seleccionar e
manter uma sequncia lgica (ex: coluna de cima para baixo, linha esquerda para a direita, etc). Existem
vrias tabelas de nmeros aleatrios com sequncia de trs, quatro ou cinco nmeros. Essas tabelas tambm
podem ser obtidas em programas como Excel.

16
Estatistica e Bioestatstica
2014
Apesar de se pretender representatividade quando recorremos a uma tcnica de amostragem aleatria, pode
ocorrer que a amostra no seja representativa da populao.

Por exemplo, uma populao formada por 50% de mulheres e 50% de homens, a amostragem probabilstica
simples pode resultar numa amostra de 65% de mulheres e 35% de homens. Nesse caso a amostra continua a
ser aleatria, mas no representativa.

Uma amostra aleatria simples poder ser constituida segundo duas tcnicas:

amostra com reposio


amostra sem reposio

Na amostragem com reposio, a unidade selecionada retorna para a populao. Portanto, em cada nova
seleco, a populao mantm a mesma quantidade de unidades elementares.

Na amostragem realizada sem reposio, a unidade seleccionada no retorna para a populao. Portanto, em
cada seleo a populao reduzida de uma unidade elementar.

importante observar que, em geral, as amostragens so realizadas sem reposio e os clculos estatsticos
nos dois tipos de amostragens so os mesmos.

Por exemplo, numa pesquisa de inteno de voto para escolha do presidente da republica, espera se que cada
pessoa seja entrevistada apenas uma vez. Se o tamanho da populao for suficientemente maior que o tamanho
da amostra, (pelo menos vinte vezes), os resultados estatsticos das amostras com e sem reposio no sero
muito diferentes, pois a probabilidade de escolher o mesmo elemento muito pequena. Contudo, deve-se ter
cuidado redobrado quando a populao pequena quando comparadas com o tamanho da amostra a ser
extrada.

3.1.1.1.1 - E1:
Imagine que queria identificar uma amostra aleatria simples de 12 centros de sade de um total de 372 de uma
determinada sub-regio, para passar um inqurito ou consultar um conjunto de processos clinicos. Os nomes
dos centros estavam disponveis na administrao regional dessa mesma regio. Como regra de aleatorizao
usou a oitava coluna de nmeros aleatrios de cinco dgitos da tabela 1, ignorou os dois primeiros dgitos
aleatrios em cada um dos grupos de nmeros aleatrios de cinco dgito., comeou com o nmero aleatrio 108
(resultado de um sorteio) e continuou de cima para baixo na coluna de nmeros aleatrios.

Qual foi o resultado da seleco1?

No caso da tcnica de amostragem em referencia, sendo N o nmero total de elementos da populao e n


o nmero total de elementos da amostra, a probabilidade de cada elemento pertencer amostra ser de n/N.

a mais simples de ser obtida mas, como j referimos, contudo, a sua aplicao restringe-se investigao de
caractersticas distribudas homogeneamente na populao.

3.1.1.1.2 - Amostragem Sistemtica

1 Resoluo: 108 290 201 292 322 009 244 249 226 125 147 113

17
Estatistica e Bioestatstica
2014
Tal como a tcnica de amostragem aleatria simples, s se pode utilizar quando existe uma lista ordenada de
elementos da populao, seja por ordem alfabtica, seja em arquivo, processo clinico ou numa lista telefnica.

Esta tcnica consiste em retirar K elementos dessa lista sendo o primeiro elemento da amostra retirado ao
acaso. O que a faz diferir da tcnica anterior o tamanho do intervalo, que aqui corresponde razo entre o
tamanho da populao e da amostra.

aplicada em populaes finitas; os elementos so escolhidos por um sistema, utilizando a sua ordenao
natural (listagens, registos, alunos, etc.). Define-se a quantidade k que a sigla que representa o intervalo de
amostragem (k=N/n); a seguir deve ser sorteado o incio do sistema, a partir do qual sero definidos os
elementos amostrais para cada k.

Face ao exposto podemos referir que uma amostra sistemtica de tamanho n constituda dos elementos de
ordem K, K + r, K + 2r, ...,

onde

K um inteiro escolhido aleatoriamente entre 1 e n

r o inteiro mais prximo da frao N/n.

j que esta tcnica de amostragem em populaes que possuem os elementos ordenados, em que no h a
necessidade de construir um sistema de referncia, a seleco dos elementos que comporo a amostra pode ser
feita por um sistema criado pelo pesquisador.
N
K
Exemplo 1 n

Obter uma amostra de 80 casas de uma rua que contm 2000 casas. Nesta tcnica de amostragem, podemos
realizar o seguinte procedimento:

1) Como 2000 dividido por 80 igual a 25, escolhemos, por um mtodo aleatrio (por exemplo sorteio)
qualquer, um nmero entre 1 e 25, que indica o primeiro elemento seleccionado para a amostra.

2) Consideramos os demais elementos, periodicamente, de 25 em 25.

Se o nmero sorteado entre 1 e 25 for o nmero 8, a amostra ser formada pelas casas: 8, 33, 58, 83, 108,
etc.

Apesar de esta tcnica ser de fcil execuo, h a possibilidade de haver ciclos de variao, que tornariam a
amostra no-representativa da populao.

Por exemplo, se a populao tem 100 elementos e vamos escolher uma amostra de tamanho 6, K um inteiro
escolhido aleatoriamente entre 1 e 6 e r = 100/6 = 16,6 = 17.

Se K = 3, a amostra ser composta pelos seguintes elementos: 3, 20, 37, 54, 71, 88.

Se o tamanho da populao desconhecido, no podemos determinar exatamente o valor de r. Escolheremos


intuitivamente um valor razovel para r.

18
Estatistica e Bioestatstica
2014
s vezes a amostragem sistemtica preferida amostragem aleatria simples, porque mais fcil de executar,
estando portanto sujeita a erros, e proporciona mais informaes com menor custo.

Exemplo: tcnica adequada para extrair uma amostra de 50 internautas de um cibercaf

Soluo: A amostragem aleatria simples no pode ser empregada neste caso, pois o entrevistador no pode
determinar quais os utilizadores a serem includos na amostra, uma vez que no se conhece o tamanho N da
populao, at que todos os internautas tenham ido ao respectivo cibercaf.

A amostragem sistemtica a mais apropriadas pois podemos defenir um intervalo (digamos 1 em cada 20
internautas que aparecam para utilizar a internet) at obter a amostra do tamanho desejado.

3.1.1.1.2 E1:
Em 1500 alunos de uma escola foram sorteados 150 para compor a amostra de um estudo. Estando esses
alunos ordenados em listagens, ficou definido o seguinte intervalo de sorteio:

1500 150 = 10

Sorteou-se um nmero entre para dar incio composio da amostra cujo resultado foi 3

Quais foram as unidades amostrais2?

3.1.1.1.2 E2:
Defina k para uma amostra de 100 indivduos com a populao de 10003

3.1.1.1.3 - Amostragem Aleatria Estratificada


A amostragem estratificada utiliza-se quando a populao possui caractersticas que permitem a criao de
subconjuntos, j que nestes casos as amostras extradas por amostragem simples so menos representativa.

Com efeito, a amostragem aleatria estratificada mais uma variante da amostra aleatria simples, uma vez
que aps diviso da populao alvo em subgrupos homogneos chamados estratos, a seguir se tira de forma
aleatria uma amostra de cada estrato.

A Amostragem aleatria estratificada utilizada, ao contrrio das anteriores, quando a populao inteira
reconhecida por certas caractersticas precisas, tais como a idade, o sexo, a incidncia de uma condio de
sade, tudo isto para assegurar a melhor representatividade possvel. Com efeito, quando os elementos da
populao esto divididos em grupos no sobrepostos, mais fcil e mais eficiente escolher,
independentemente, uma amostra aleatria simples dentro de cada um destes grupos, os quais so chamados
estratos.

2 3 + 13 + 23 + 33 + ... + 1493.

3 10

19
Estatistica e Bioestatstica
2014
Esta forma de amostragem uma das mais utilizadas, j que a maioria das populaes tm estratos bem
definidos: os homens e as mulheres; os alunos das escolas X, Y, Z; os operrios pertencentes aos indices
salariais 190, 195, etc.

O mais comum utilizar-se a amostragem estratificada proporcional, que consiste em seleccionar os elementos
da amostra entre os vrios estratos, em nmero proporcional ao tamanho de cada um dos estratos.

Como a populao se divide em subconjuntos, convm que o sorteio dos elementos leve em considerao tais
divises, para que os elementos da amostra representem o nmero de elementos desses subconjuntos. Como
exemplo observe a figura abaixo:

FIGURA 4: AMOSTRA ESTRATIFICADA

Em outras palavras, sejam:


N - o nmero de elementos da populao
L - o nmero de estratos
Ni - o nmero de elementos do estrato i
n - o tamanho da amostra a ser seleccionada.

Note-se que: N = N1 + N2 + ... + NL

Nmero de elementos a serem sorteados em cada estrato ser: N1f, N2f, ..., Nkf

Exemplo 1:

Numa populao de 200 estudantes, h 120 rapazes e 80 raparigas. Pretende-se extrair uma amostra
representativa, de 10%, dessa populao.

Neste exemplo, h uma caracterstica que permite identificar 2 subconjuntos, a caracterstica Sexo.
Considerando essa diviso, vamos considerar a populao e extrair a amostra da populao.

SEXO POPULAO AMOSTRA (10%)


Masculino 120 12

20
Estatistica e Bioestatstica
2014
Feminino 80 8
Total 200 20

Portanto, a amostra deve conter 12 alunos do sexo masculino e 8 do sexo feminino, totalizando 20 alunos, que
correspondem a 10% da populao.

Para seleccionar os elementos da populao para formar a amostra, podemos executar os seguintes passos:

1) Numerar os estudantes de 1 a 200, sendo os alunos numerados de 1 a 120 e as alunas, de 121 a 200;

2) Escrever os nmeros de 1 a 120 em pedaos de papel e coloc-losnumaurna A;

3) Escrever os nmeros de 121 a 200 em pedaos de papel e coloc-losnumaurna B;

4) Retirar 12 pedaos de papel, um a um, da urna A, e 8 da urna B, formando a amostra da populao.

O prximo exemplo, tambm, representa populaes com caractersticas heterogneas cujas concluses podem
ficar comprometidas se estas no forem consideradas na composio da amostra. Assim a populao
subdividida em grupos homogneos (estratos) e a amostra ser sorteada intragrupos. O tamanho de cada
estrato ser definido pela varincia da caracterstica a ser estudada ou seja proporcional (exemplo 1 e 2) ou
atravs da definio de uma percentagem dos estratos ou seja no proporcional (exemplo 3).

Exemplo 2:

Populao-Alvo

2000 estudantes em Cincias


Sociais

Classificao

Populao-Alvo
Estratificao Proporcional

Estrato 1 2000 estudantes


Estratoem
2 Cincias Estrato 3
Doutoramento
Sociais
Mestrado Licenciatura
400 = 20% 600 = 30% 1000 = 50%
Classificao

FIGURA 5: AMOSTRA ESTRATIFICADA PROPORCIONAL


Estratificao Proporcional
Escolha Aleatria
Estrato 1 Estrato 2 Estrato 3
Doutoramento Mestrado Licenciatura
Exemplo 3:
400 = 20% 600 = 30% 1000 = 50%

Estratificao No-Proporcional
Amostra = 200
Escolha Aleatria de 10% em cada Estrato
Escolha Aleatria

40 Estudantes 60 Estudantes 100 Estudantes


Doutoramento Mestrado Licenciatura
Estratificao No-Proporcional
Amostra = 200
Escolha Aleatria de 10% em cada Estrato

40 Estudantes 60 Estudantes 100 Estudantes


Doutoramento Mestrado Licenciatura

21
Estatistica e Bioestatstica
2014
FIGURA 6: AMOSTRA ESTRATIFICADA NO PROPORCIONAL

Perguntas frequentes:

1. Como calcular o valor/ percentagem apropriada para escolher dentro dos estratos?
a. A resposta simples. Utiliza-se uma formula adequada ao tamanho da populao, mas sobre esse
assunto dissertaremos mais adiante.
2. Como seleccionar os sujeitos dentro dos estratos?
a. Como estamos perante uma amostra aleatria, embora estratificada, recorre-se ao sorteio ou a uma
LNA

3.1.1.1.3 E1:
De um conjunto de 30 utentes de um servio portadores de uma determinada patologia, pretendia-se
seleccionar 8 deles para um seguimento especifico (n) em funo do seu sub-grupo (estrato de gravidade da
patologia). Em termos de severidade, 6 utentes (N1) a forma moderada da patologia e 24 utentes (N2) tinha a
forma mais grave. Calcule-se uma amostra aleatria proporcional.

Sabendo que de cada estrato constitudo por N1 e N2 sero sorteadas n1 e n2 unidades, respectivamente.

01. Aristteles 01. Anastcio 02. Arnaldo 03. Bartolomeu 04. Joaquim
02. Cardoso 05. Carlos 06. Cludio 07. Gabriel 08. Marco
03. Ernesto 09. Elisabete 10. Francisco 11. Fernando 12. Andr
13. David 14. Raul 15. Sergio 16. Nelo
04. Guilherme
17. Jorge 18. Joaquina 19. Jos da Silva 20. Mauro
05. Joana 21. Luisa 22. Maria Jos 23. Ma Cristina 24. Bernardino
06. Andreia

Assim em primeiro calcula-se o tamanho da amostra (neste caso 8 utentes) e depois a fraco (f) da
amostragem, multiplicando f por N e por fim calculamos o numero de sujeitos que devem ser escolhidos dentro
de cada estrato multiplicando f pelo tamanho de cada estrato (N1f, N2f, ..., Nkf) que neste exemplo 6 e 24

FRMULA PARA DETERMINAR A FRAO (f) PARA CADA ESTRATO


Assim o resultado seria

f= 8/30 = 0,27

Feitos os calculos recorremos a um sorteio ou a uma LNA.


No caso em explanao escolhemos uma tabela de nmeros aleatrios e seleccionmos os 2 do estrato que
apresentam grau moderado e os 6 utentes do que apresentam grau severo da patologia em causa, seguindo a
regra :

Os primeiros 2 numeros no superiores a 6 (j que 6 o numero mximo possvel) e os primeiros 6 numeros


no superiores a 24 (j que este o numero mximo neste estrato).

De acordo com a regra para a seleco escolhida (comecar no 6. numero da 2. linha em ambos os casos e
quando chegar ao fim da tabela subir pelo lado esquerdo virando direita) quais os utentes seleccionados?

22
Estatistica e Bioestatstica
2014
59 58 48 36 47 92 85 05 38 65 47 49 10 41 05 10 75 59 75 99 17 28 97 99 75
53 26 21 50 21 37 93 85 52 86 86 22 75 34 37 69 85 25 03 78 50 26 18 25 10

Os resultados foram:

01. Aristteles 01. Anastcio 02. Arnaldo 03. Bartolomeu 04. Joaquim
02. Cardoso 05. Carlos 06. Cludio 07. Gabriel 08. Marco
03. Ernesto 09. Elisabete 10. Francisco 11. Fernando 12. Andr
13. David 14. Raul 15. Sergio 16. Nelo
04. Guilherme
17. Jorge 18. Joaquina 19. Jos da Silva 20. Mauro
05. Joana 21. Luisa 22. Maria Jos 23. Ma Cristina 24. Bernardino
06. Andreia

Confira.

Veja a diferena entre quem era selecionado por este mtodo ou se tivssemos escolhido uma amostra aleatria
simples.

A tabela que se segue tem os utentes numerados de 1 a 30

01. Aristteles 02. Anastcio 03. Arnaldo 04. Bartolomeu 05. Joaquim
06. Cardoso 07. Carlos 08. Cludio 09. Gabriel 10. Marco
11. Ernesto 12. Elisabete 13. Francisco 14. Fernando 15. Andr
16. Guilherme 17. David 18. Raul 19. Sergio 20. Nelo
21. Joana 22. Jorge 23. Joaquina 24. Jos da Silva 25. Mauro
26. Andreia 27. Luisa 28. Maria Jos 29. Ma Cristina 30. Bernardino
31. Paula 32. Paulo Csar

59 58 48 36 47 92 85 05 38 65 47 49 10 41 05 10 75 59 75 99 17 28 97 99 75
53 26 21 50 21 37 93 85 52 86 86 22 75 34 37 69 85 25 03 78 50 26 18 25 10

01. Aristteles 02. Anastcio 03. Arnaldo 04. Bartolomeu 05. Joaquim
06. Cardoso 07. Carlos 08. Cludio 09. Gabriel 10. Marco
11. Ernesto 12. Elisabete 13. Francisco 14. Fernando 15. Andr
16. Guilherme 17. David 18. Raul 19. Sergio 20. Nelo
21. Joana 22. Jorge 23. Joaquina 24. Jos da Silva 25. Mauro
26. Andreia 27. Luisa 28. Maria Jos 29. Ma Cristina 30. Bernardino

(confira os seus resultados com as solues que apresentmos).

As diferenas so evidentes, apenas 1 com patologia moderada era seleccionado e dos restantes apenas a M
Jos coincidia. As regras so importantes e a tcnica de seleco faz toda a diferena.

Com efeito, entre as vantagens da amostragem estratificada destacam-se:

Os dados so geralmente mais homogneos dentro de cada estrato do que na populao como um todo;

O custo da recolha e anlise dos dados frequentemente menor do que na aleatria simples, devido a
convenincias administrativas;

23
Estatistica e Bioestatstica
2014
Podem-se obter estimativas separadas dos parmetros populacionais para cada estrato sem seleccionar outra
amostra e, portanto, sem custo adicional.

3.1.1.1.4 - Amostragem em Cachos ou conglomerados


Consiste em retirar de forma aleatria os elementos por cachos em vez de unidades. til quando os elementos
da populao esto naturalmente por cachos e por isso devem ser tratados como grupos ou quando no
possvel obter uma listagem de todos os elementos da populao-alvo. Como exemplo de amostragem por
cachos podemos referir a escolha de um grupo de escolas C+S para avaliar o conhecimento que os alunos do 5
e 6 anos tm acerca da recolha e separao de resduos. Como seria muito difcil obter uma lista de todos os
alunos que frequentam aqueles anos e escolher aleatoriamente quais constituram a amostra recorre-se a
cachos (escolas) e dentro destas far-se- a seleco. importante reter que em qualquer tipo de agrupamento
(cachos ou estratos), a amostra s considerada probabilstica se os grupos foram escolhidos ao acaso antes
da repartio aleatria dos sujeitos nos grupos.

Uma amostra por cachos ou conglomerado uma amostra aleatria simples na qual cada unidade de
amostragem um grupo, um cacho ou um conglomerado de elementos.

O primeiro passo para se usar este processo especificar os cachos apropriados, j que todos os elementos
devem ter caractersticas similares. Como regra geral, o nmero de elementos em cada cacho deve ser pequeno
em relao ao tamanho da populao, mas o nmero de cachos deve ser, razoavelmente, grande.

Tanto no caso da amostragem estratificada como no da amostragem por cachos, a populao deve estar
dividida em grupos. Na amostragem estratificada, entretanto, selecciona-se uma amostra aleatria simples
dentro de cada grupo (estrato), enquanto que na amostragem por cachos seleccionam-se amostras aleatrias
simples de grupos, e todos os itens dentro dos grupos (conglomerados) seleccionados faro parte da amostra.

A amostragem por cachos recomendada quando:


Ou no se tem um sistema de referncia listando todos os elementos da populao, ou a obteno dessa
listagem dispendiosa;

O custo da obteno de informaes cresce com o aumento da distncia entre os elementos.

24
Estatistica e Bioestatstica
2014
3.1.1.1.4 E1:
Suponha que se deseja estimar a despesa mdia mensal que uma familia tem com a sade numa cidade grande,
como deve ser escolhida a amostra?

Soluo:

A amostragem aleatria simples invivel, pois pressupe uma listagem de todas as famlias da cidade, o que
praticamente impossvel de se obter.

A alternativa da amostragem estratificada tambm invivel, j que aqui tambm necessria uma listagem
dos elementos por estrato.

A melhor escolha amostragem por cachos. O sistema de referncia pode ser constitudo por todas as
freguesias da cidade. Cada freguesia um cacho. Extrai-se uma amostra aleatria simples das freguesias e
nelas pesquisa-se a despesa familiar em todas as casas.

3.1.2 As Amostragens No Probabilsticas:

um procedimento de seleco segundo o qual cada elemento da populao no tem a mesma probabilidade de
ser escolhido para formar a amostra. Este tipo de amostragem tem o risco de ser menos representativa que a
probabilstica no entanto muitas vezes o nico meio de construir amostras em certas disciplinas profissionais
nomeadamente na rea da sade. Este tipo de amostragens requerem critrios de incluso e excluso rgidos
para evitar o maior numero possvel de viezes. O tamanho da amostra neste tipo de amostragens muito
importante pois quanto maior for menor a probabilidade de que casos idiosincrticos possam afectar o todo
de uma forma significativa. Da que as amostras provindas deste tipo de amostragens devam ter sempre um n
suferior aquele que seria representativo do todo se utilizasse uma amostragem do tipo probabilistica

3.1.2.1. Tcnicas de Amostragens No-Probabilsticas:

A Amostragem Acidental ou de Convenincia (por substituio da aleatria simples);

A Amostragem por Cotas (por substituio da amostragem estratificada ou por cachos);

A Amostragem de Seleco Racional ou Tipicidade (por substituio da estratificada);

A Amostragem por Redes ou Bola de Neve (por substituio da sistemtica).

3.1.2.1.1 - Amostragem Acidental ou de Convenincia


formada por sujeitos facilmente acessveis, que esto presentes num determinado local e momento preciso.

Neste tipo de amostra tem a vantagem de ser simples de organizar e pouco onerosa, todavia este tipo de
amostra provoca enviesamentos, pois nada indica que as primeiras 30 a 40 pessoas sejam representativas da
populao-alvo. So utilizadas em estudos que no tm como finalidade a generalizao dos resultados. Esse
tipo de amostragem, embora no aleatria, bastante utilizada na rea da sade, geralmente so amostras
obtidas em consultrios, hospitais, etc. Neste caso, importante o senso crtico do pesquisador para evitar
vieses, por exemplo, no seleccionar sempre pessoas de mesmo sexo, de mesma faixa etria, etc. utilizando

25
Estatistica e Bioestatstica
2014
critrios especficos de incluso/ excluso. Uma tcnica possvel de aproximar este tipo de amostragens o mais
possvel s probabilsticas ir verificando, medida que os dados vo sendo colhidos, se os seus subgrupos
esto, proporcionalmente populao alvo, representados na amostra.

3.1.2.1.2 - Amostragem por Cotas


Idntica amostragem aleatria estratificada, j que constituda por um nmero pr-determinado de pessoas
em cada uma das vrias categorias da populao.

A amostragem por cotas difere da estratificada apenas pelo facto dos sujeitos no serem escolhidos
aleatoriamente no interior de cada cota ou de cada grupo.

3.1.2.1.3 - Amostragem por Seleco Racional, Julgamento ou por Tipicidade


Tem por base o julgamento do investigador ou especialista para constituir uma amostra de sujeitos em funo
do seu carcter tpico ou atpico cujos membros tenham boas perspectivas de fornecerem as informaes
necessrias ao estudo. Por exemplo: o estudo de casos extremos ou desviantes como uma patologia rara ou uma
instituio.

3.1.2.1.5 - Amostragem por Redes ou Bola de Neve


Consiste em escolher sujeitos que seriam difceis de encontrar de outra forma. Toma-se por base, redes sociais
amizades e conhecimentos. Por exemplo: quando o investigador encontra sujeitos que satisfazem os critrios
escolhidos pede-lhes que indiquem outras pessoas de caractersticas similares.

3.2 Propriedades da distribuio normal

A distribuio Normal a mais familiar das distribuies de probabilidade e tambm uma das mais importantes
em estatstica. Esta distribuio tem uma forma de sino.

1 - A varivel aleatria X pode assumir todo e qualquer valor real.

2 - A representao grfica da distribuio normal uma curva em forma de sino, simtrica em torno da
mdia, que recebe o nome de curva normal ou de Gauss.

26
Estatistica e Bioestatstica
2014
3 - A rea total limitada pela curva e pelo eixo das abscissas igual a 1, j que essa rea corresponde
probabilidade de a varivel aleatria X assumir qualquer valor real.

4 - A curva normal assinttica em relao ao eixo das abscissas, isto , aproxima-se indefinidamente do eixo
das abscissas sem, contudo, alcan-lo.

5 - Como a curva simtrica em torno da mdia, a probabilidade de ocorrer valor maior que a mdia igual
probabilidade de ocorrer valor menor do que a mdia, isto , ambas as probabilidades so iguais a 0,5 ou 50%.
Cada metade da curva representa 50% de probabilidade.

Mas a curva afectada pelos valores numricos de e . Ver diagrama ao lado.

A notao para a distribuio gaussiana : ~N (, )

A rea sob a curva


normal (na verdade
abaixo de qualquer
funo de densidade de
probabilidade) 1.
Ento, para quaisquer
dois valores especficos
podemos determinar a
proporo de rea sob a
curva entre esses dois
valores.

Para a distribuio Normal, a proporo de valores caindo dentro de um, dois, ou trs desvios padro da mdia
so:

TABELA 2: DISTRIBUIO NORMAL E RESPECTIVOS DESVIOS


Amplitude Proporo
1 68.3%
2 95.5%
3 99.7%

Ou seja, a mdia mais ou menos um desvio, tem rea de 0,683 sob a curva, ou, uma probabilidade de 68,3%. A
mdia mais ou menos dois desvios tem probabilidade de 95,4% e a mdia mais trs desvios e menos trs
desvios, tem 99,7% de probabilidade

Quando a distribuio possui mdia zero e desvio-padro igual a um, ela chamada de distribuio gaussiana
padro. Uma varivel que tem a curva de Gauss padro como distribuio denotada pela letra Z e
representada por Z ~ N(0,1).

O clculo de probabilidade a rea sob a curva, e as tabelas trazem o valor da probabilidade calculada de
forma numrica. As tabelas com a distribuio gaussiana so padronizadas, ento, se a varivel no tem mdia
zero e desvio-padro igual a 1, necessrio padroniz-la:

27
Estatistica e Bioestatstica
2014
Frmula para padronizar tabelas com distribuio gaussiana

Para a distribuio normal, graficamente, tm-se

A distribuio normal calculada no intervalo P(a < Z < b) a rea dada :

ento pode-se escrever P(a < Z < b) = P(Z < b) - P(Z<a).

28
Estatistica e Bioestatstica
2014
Exemplo: Seja X a varivel aleatria que representa a amplitude da onda R em V1 o padro
electrocardiogrfico normal em crianas. Vamos supor que essa varivel tenha distribuio normal com mdia
= 0,15 e desvio padro = 0,04. Qual a probabilidade de uma criana ter uma amplitude entre 0,15 e 0,2?

P ( 0,15 < X < 0,2) = ?

Com o auxlio de uma distribuio normal reduzida, isto , uma distribuio normal de mdia = 0 e desvio
padro = 1. Resolveremos o problema atravs da varivel z , onde z = (X - ) / S. Utilizaremos tambm uma
tabela normal reduzida, que nos d a probabilidade de z tomar qualquer valor entre a mdia 0 e um dado valor
z, isto : P ( 0 < Z < z). Temos, ento, que se X uma varivel aleatria com distribuio normal de mdia e
desvio padro S, podemos escrever: P( < X < x ) = P (0 < Z < z)

No nosso problema queremos calcular P(0,15< X < 0,154). para obter essa probabilidade, precisamos, em
primeiro lugar, calcular o valor de z que correponde a x = 0,2

z = (0,2 0,15) / 0,04 = 1,25

Utilizao da tabela Z reduzida

TABELA 3: CURVA NORMAL - TABELA Z (REDUZIDA)

Procuremos, agora, na tabela Z o valor de z = 1,25

Na primeira coluna encontramos o valor at uma casa decimal = 1,2. Em seguida, encontramos, na primeira
linha, o valor 0,05, que corresponde ao ltimo algarismo do nmero 1,25. Na interseco da linha e coluna
correspondentes encontramos o valor 0,3944, o que nos permite escrever: P (0 < Z < 1,25 ) = 0,3944 ou 39,44

29
Estatistica e Bioestatstica
2014
%, assim a probabilidade de uma certa criana apresentar uma amplitude da onda R em V1 entre 0,15 e 0,2
de 39,44 %.

Exerccios resolvidos do uso de z lendo uma tabela normal reduzida

Qual a rea sob a curva normal contida entre z = 0 e z = 2 (ou z = -2)?

Procura-se o valor 2,0 nas linhas da tabela de z e o valor 0,00 na coluna. O valor da interseco de 0,4772,
ou seja, 47,72%. Entretanto, lembrando que a curva normal simtrica, sabe-se que a rea sob a curva contida
entre z = 0 e z = -2 tambm 47,72%, somam-se ambas e a rea referente a -2 < z < 2 vale 95,44%.

Qual a rea sob a curva normal contida entre z = 0 e z = 3 (ou z = -3) ?

Procura-se o valor 3,0 nas linhas da tabela de z e o valor 0,00 na coluna. O valor da interseco de 0,4987,
ou seja, 49,87%. Sabe-se que a rea sob a curva contida entre z = 0 e z = -3 tambm 49,87% j que a curva
normal simtrica. Uma vez mais, somam-se ambas e a rea referente a -3 < z < 3 vale 99,74%.

Numa populao de indivduos adultos de sexo masculino, cuja frequncia cardiaca (FC) em mdia 84,98 e
desvio padro 14,45, qual o intervalo de frequncias cardiacas em que 95% da populao est
compreendido?

0,95/2=0,475

Procuremos na tabela o valor 0,475=1,96

95% = 84,98 1,96 x 14,45 (sendo que 1,96 * 14,45 = 28,322)

A maior FC ser: 84,98 + 28,322 = 113,302 e a menor FC ser: 84,98 - 28,322 = 56,658

Assim sendo, 95% da populao tem FC entre 57 e 113 batimentos por minuto (bpm).

Ser pouco provvel encontrar algum com FC superior a 113 bpm (P = 2,5%) ou abaixo de 57 bpm (P =
2,5%).

Na mesma populao, qual a probabilidade de um indivduo apresentar FC entre 80 e 100 bpm?

Calcula-se dois valores de z:

zmin = (80 84,98) / 14,45 = -0,35

zmax = (100 84,98) / 14,45 = -1,0

Consultando a Tabela de z, verifica-se que a rea entre z = 0 e z = -0,35 de 13,68 e a rea entre z = 0 e z = 1
de 34,13%.

Portanto, a probabilidade de se encontrar algum com estatura entre 1,60 e 1,82 m de:

0,1368 + 0, 3413 = 0,4781 = 47,81%

Qual a probabilidade de se encontrar 1 indivduo com FC menor que 58 bpm?

z = (58 84,98) / 14,45 = -1,9

Consultando a Tabela de z, verifica-se que a rea entre z = 0 e z = -1,9 47,13 (0,4713). Portanto, a rea alm
de z determina a probabilidade = 50 - 47,13 = 2,87%

30
Estatistica e Bioestatstica
2014
Sabendo-se que o ndce de massa corporal numa populao de pacientes com diabetes mellitus obedece uma
distribuio normal e tem mdia = 27 kg/cm2 e desvio-padro = 3 kg/cm2, qual a probabilidade de um indivduo
sorteado nessa populao apresentar um ndce de massa corporal entre 26 kg/cm2 e a ?

Como z = ( x - ) /, z = ( 26 - 27 ) / 3, z = - 0,333

Consultando a Tabela de z, verifica-se que a rea entre 26 e 27 igual a 0,1293. Portanto, a probabilidade de
um indivduo sorteado nessa populao ter indice de massa corporal entre esses valores 12,93%.

Quando uma amostra tem n > 30 uma curva binomial tende a assemelhar-se a uma curva normal. No caso de n
= 31 a distribuio (p + q) ter os seguintes valores:

Se p = 0,5 q = 0,5 Se p = 0,75 e q = 0,25

= 15,5 e s = 2,78 = 7,75 e s = 2,41


95% da distribuio est entre 10,05 e 20,95 95% da distribuio est entre 3,02 e 12,47
(Confira este resultado). (Confira este resultado).

4. Determinao do Tamanho da Amostra

Os tamanhos das amostras so relativos, isto , depende do tamanho da populao. Para determinar as
amostras existem vrias frmulas, consoante o parmetro em critrio. As mais utilizadas na sade so as que se
baseiam na percentagem (proporo) do fenmeno.

A amostra depende da extenso do universo; do Nvel de Confiana; do Erro Mximo permitido; da


percentagem com que o fenmeno se verifica. Os universos de pesquisa podem ser finitos ou infinitos.
Convencionou-se que os finitos so aqueles cujo nmero de elementos no excede a 100.000 e os infinitos, por
sua vez, so aqueles que apresentam elementos em nmero superior a esse.

Este tpico apresenta alguma dificuldade tcnica e s um conhecedor dos detalhes da situao, poder calcular
o tamanho da amostra necessria numa pesquisa especfica.

4.1 Clculo do Tamanho da Amostra para Populaes Infinitas

Relativamente aos clculos a efectuar neste ponto, limitar-nos-emos a apresentar algumas frmulas para
clculo do tamanho da amostra em duas situaes simples, admitindo que ser usada a amostragem aleatria
simples.

4.1.1.Proporo
Se o problema de partida do tipo dicotmico (presena ou ausncia do acontecimento ou fenmeno em estudo)
e queremos, com nvel de confiana, (1 ) que a proporo estimada esteja, no mximo, a uma distncia d da
proporo verdadeira (erro amostral, tambm denotado com a letra ), ou seja, se queremos que

O valor de n dado por onde

31
Estatistica e Bioestatstica
2014
P uma estimativa preliminar de p; Q = 1 P e d (ou ) o maior desvio aceitvel ou erro amostral.

As notaes mais comuns para esta frmula so

Frmula para populaes infinitas e varivel dicotmica [ z / 2 ] 2 p ' q '


n
2
ou [ z / 2 ] 2 p ' q '
n
d2

Como obtemos o Z para a formula do clculo amostral?

Os estudos estatsticos aprofundados deram origem a uma tabela a que chamamos tabela de distribuio
normal padro e a essa tabela que vamos buscar o valor de Z para o nvel de confiana que pretendemos,
que o mtodo estatstico para expressar a nossa aproximao estimada ao valor da populao. Esta tabela ao
contrrio da tabela reduzida apresenta os valores padro

TABELA 4:DISTRIBUIO NORMAL PADRO

Comeamos por aplicar a formula em


funo do nvel de confiana escolhido
(1 ). Se escolhemos um de 5% para
um o valor de Z / 2 a consulta na tabela
resultar do clculo de 1-0,025=0,975.

32
Estatistica e Bioestatstica
2014
Procuramos este valor na tabela e Z ser igual contigencia da primeira parte inteira e primeira decimal de Z
com a segunda decimal de Z.

Mas se escolhemos um de 10% para um o valor de Z /2 a consulta na tabela resultar do clculo de 1-


0,05=0,95. Procuramos
este valor na tabela e Z
ser igual
z tal que A(z)=0,95
contigencia da
primeira parte inteira e Pela tabela z = 1,64 ou 1,65
primeira decimal de Z
com a segunda decimal
de Z.
Z

Exemplo: queremos realizar uma pesquisa de opinio pblica para determinar a proporo de pessoas que
sofreram leses respiratrias devido a contgio em meio hospitalar (visitas a familiares doentes, marcaes de
consulta, etc.). Quantas pessoas devero ser ouvidas para que sejam satisfeitas as seguintes condies: =
0,02, p = 10%, = 5%

Soluo: [ z / 2 ]2 p' q' [1,96]2 (0,1)(0,9)


n 865
2
0,022

4.1.1 E1:
Suponha que quer conhecer o valor de Z /2 para um de 1% ?

Qual o resultado4?

4.1.1 E2:
Para um fenmeno que tenha uma prevalncia de 25%, quantas pessoas devero constituir a amostra para que
sejam satisfeitas as seguintes condies: = 0,05, p = 25%, = 5%5?

Resolva:

4 z / 2
=2,58
[ z / 2 ]2 p' q' [1,96]2 (0,25)(0,75)
n 238
5 2 0,052

33
Estatistica e Bioestatstica
2014

4.1.1 E3:
Desejamos estimar, com uma margem de erro de 3%, a percentagem de motoristas profissionais que referem
sonolencia durante a conduo, considerando =0,05. em que a proporo estimada de 18% esteja, no
mximo, a uma distncia [] da proporo verdadeira de 3%.

Quantos motoristas constituiriam a amostra?6 Calcule.

Supondo que no tinhamos nenhuma estimativa de pa frmula de clculo deveria ser:

Frmula para populaes infinitas quando no temos nenhuma estimativa de p

[ z / 2 ]2 0,25
n
2
2
Com efeito, observando a tabelas da distribuio normal padro, f(x) j cobre 0,975 ( [ z / 2 ] =1,96), pelo que
basta acrestentar o 0,25 na formula para que se cubra toda a area da distribuio (1).

4.1.1 E4:
E se no tivessemos nenhuma estimativa, quantos motoristas constituiriam a amostra se mantivessemos o
mesmo ?7

[ z / 2 ]2 p' q' [1,96]2 (0,18)(0,82)


n 630,0224 631
6 2
0,032

[ z / 2 ]2 0,25 [1,96]2 0,25


n 1067,1111 1068
7 2 0,032

34
Estatistica e Bioestatstica
2014
4.1.2. Determinao da Margem de Erro da Amostra

A Margem de erro de uma amostra que, por sua vez, representa aproximadamente (e nunca exactamente) uma
populao lida assim:

se uma pesquisa tem uma margem de erro de 2% e a Doena Cardaca teve 25% de prevalncia na amostra
recolhida, podemos dizer que, naquele instante, na populao, ela ter uma prevalncia entre 23% e 27% (25%
menos 2% e 25% mais 2%).

Nvel de confiana As pesquisas so feitas com um parmetro chamado nvel de confiana, geralmente de
95%. Estes 95% querem dizer o seguinte: se realizarmos uma outra pesquisa, com uma amostra do mesmo
tamanho, nas mesmas datas e locais e com o mesmo instrumento de recolha de dados, h uma probabilidade de
95% de que os resultados sejam os mesmos (e uma probabilidade de 5%, claro, de que tudo difira).

Quando j se efectivou uma pesquisa e se deseja conhecer a margem de erro utilizada (no esquecer que uma
amostra sempre finita) aplica-se:

Frmula paraconhecer a margem de erro padro p = (p.q)


n
Onde:

n = Tamanho da amostra

p = Erro padro ou desvio da percentagem com que se verifica determinado fenmeno

p = percentagem do fenmeno

q = percentagem complementar

Exemplo: Numa pesquisa efectuada com 1000 adultos, verificou-se que 30% bebem caf pelo menos uma vez
por dia. Qual a probabilidade de que tal resultado seja verdadeiro para todo o universo.

p = (30.70)
1000
p = 1,45

Como o valor encontrado (margem de erro) corresponde a um desvio, ento para dois desvios (95,5%), temos
1,45 *2=2,90.

Para 3 desvios o triplo (4,35).

Isto significa que, por exemplo, para um nvel de confiana de 95% (2 desvios) o resultado da pesquisa
apresentar como margem de erro 2,90 para mais ou menos.

provvel, portanto, que o n. de consumidores de caf esteja entre 27,10% (30%-2,90) e 32,90% (30%+2,90).

35
Estatistica e Bioestatstica
2014

4.2. Clculo do Tamanho da Amostra para Populaes finitas

4.2.1. Proporo

Uma das formulas comummente aplicada no clculo das amostras finitas constituida por dois tipo de clculos:

A Primeira parte da amostra d-nos uma primeira aproximao do tamanho da amostra (n0), isto , um grupo
alvo para servir de apoio estatistico de clculo, pois sabemos que existem menos de 100.000 elementos e
embora no saibamos quantos existem sabemos que so demasiadas para partir do numero exacto (por exemplo
aproximadamente 20.000 elementos). 1
n0
E02

A segunda parte da amostra calculada a partir da primeira aproximao, que corresponde ao grupo alvo.

N .n0
n
N n0

Frmula para populaes finitas

1 N .n0
n0 e n
E02 N n0

Onde:

N = tamanho da populao

E0 = erro amostral tolervel

n0= primeira aproximao do tamanho da amostra

n = tamanho da amostra

Exemplo

N=200 famlias, E0=4%(0,04)

n0=1/(0,04)2 n0=625 famlias

n = 200x625/200+625 n = 152 famlias

36
Estatistica e Bioestatstica
2014
4.2.1 E1:
Para N=20.000 famlias qual o tamanho da amostra8

4.2.1 E2:
Numa pesquisa para uma eleio presidencial, qual deve ser o tamanho de uma amostra aleatria simples, se se
deseja garantir um erro amostral no superior a 2% 9?

Resolva

Numa escola com 1000 alunos, deseja-se estimar a percentagem dos que esto satisfeitos com a direco. Qual
deve ser o tamanho da amostra aleatria simples que garanta um erro amostral no superior a 5%10?

Resolva

4.2.2. Mdia

Quando utilizamos dados amostrais calcula-se um valor da estimativa do parmetro populacional e com isso
tem-se uma estimativa por ponto do parmetro analisado, contudo podemos no ter acesso a um ponto mdio
mas um intervalo mdio

Assim, o valor da mdia amostral ( x ) uma estimativa por ponto da mdia populacional (). De maneira
anloga, o valor do desvio padro amostral (s) constitui uma estimativa do parmetro ()

Por exemplo, uma amostra aleatria de 200 alunos de uma universidade de 20.000 estudantes revelou uma
mdia amostral de 5,2. Logo x = 5,2 uma estimativa pontual da verdadeira nota mdia dos 20.000 alunos.

8
n = 20.000x625/20.000+625 n = 623 famlias
9
n = n0 = 1/(0,02)2 = 1/0,0004 = 2500 eleitores
10
N = 1000 empregados
E0 = erro amostral tolervel = 5% (E0 = 0,05)
n0 = 1/(0,05)2 = 400 alunos
n = 1000x400/(1000+400) = 286 alunos

37
Estatistica e Bioestatstica
2014
Neste caso necessrio:

Controlar o erro relativo da estimativa da mdia de uma caracterstica da populao, com nvel 1 - de
confiana: ou seja, queremos:

Onde = mdia amostral,

= mdia populacional.

Neste caso o valor de n dado por

onde

s=desvio padro preliminar

r=erro relativo

=mdia preliminar

Exercicio resolvido:Quantos doentes devem ser examinados num servio de ressonncia magntica para se
determinar ao nvel = 5% e com r = 10%, e durao mdia por atendimento, =40 minutos e s = 10
minutos?

Soluo:

Se

Ento:
2
2 (1,96) (10)
=( ) =[ ] = 24
(0,1) (40)

J uma estimativa por intervalo para um parmetro populacional um intervalo determinado por dois nmeros,
obtidos a partir de elementos amostrais, que se espera que contenham o valor do parmetro com dado nvel de
confiana ou probabilidade de (1 - )%. Geralmente (1 - )% = 90%, 95%, 99% so os mais usados.

Por exemplo, o intervalo (1,60 m; 1,64m) contm a altura mdia dos moradores do municpio X, com
nvel de confiana de 95%..

38
Estatistica e Bioestatstica
2014
Note-se a necessidade de estimativas preliminares dos parmetros, o que constitui mais uma razo para se fazer
um estudo piloto.

1. Controlar o erro absoluto da mdia, ou seja, se quisermos que

O valor de n dado por

onde,

= desvio padro populacional,

d = distncia da mdia estimada mdia verdadeira.

4.2.2 E1:

Quantos doentes devem ser examinados num servio de ressonncia magntica para se determinar a um Z /2
de 95% com uma distncia da mdia estimada mdia verdadeira de 5% e desvio padro populacional de 12
minutos 11?

Resolva:

5. Estatstica Descritiva e Indutiva

A Estatstica Descritiva recolhe, organiza e analisa os dados de uma amostra, sem tirar qualquer concluso
sobre um grupo maior.

A Estatstica Indutiva recolhe, organiza, analisa e estabelece relaes entre os dados para fazer inferncias
sobre a populao. Com base nos resultados obtidos sobre a amostra podemos inferir concluses vlidas sobre

2 (1,96) (12) 2
11
=( ) =[ ] = 23
5

39
Estatistica e Bioestatstica
2014
a populao (este ramo da Estatstica j exige a utilizao de recursos matemticos especiais, nomeadamente a
Teoria das Probabilidades).

Assim, a Estatstica Indutiva permite-nos fazer inferncias sobre a populao e chegar a leis e a teorias.

5.1. Indivduo ou Unidade Estatstica

O estudo Estatstico recai sobre a amostra, no entanto este feito de modo pormenorizado a cada um dos
elementos da amostra, que so designados por Indivduo ou Unidade Estatstica.

Unidade Estatstica: o factor elementar, o objecto de anlise, que independentemente da sua natureza tem que
possuir uma definio precisa.

As principais caractersticas de uma boa unidade Estatstica so: Propriedade ou adequao ao objectivo da
investigao; Clareza; Mensurabilidade; Comparabilidade.

Parmetro - uma caracterstica numrica estabelecida para toda uma populao.

Estimador - uma caracterstica numrica estabelecida para uma amostra.

Dado Estatstico - sempre um nmero real.

Primitivo ou Bruto: aquele que no sofreu nenhuma transformao matemtica. Nmero direto.

Elaborado ou secundrio: aquele que sofreu transformao matemtica. Ex. porcentagem, mdia, etc.

No estudo de cada unidade Estatstica, surgem resultados individuais com os quais so feitas as inferncias
sobre a populao. Estes resultados tm o nome de Dado Estatstico.

Dado Estatstico: o resultado do estudo efectuado a cada unidade Estatstica tendo em conta a sua
individualidade, sendo este depois tratado de modo a permitir inferir sobre a colectividade que a integra
(populao).

5.2 Varivel Estatstica

Ao ser efectuada uma anlise Estatstica a uma populao, os aspectos (caractersticas) que se tm em conta,
um ou vrios, so denominados por Varivel Estatstica.

40
Estatistica e Bioestatstica
2014
Os elementos da populao sero observados segundo a indagao que tenhamos, ou seja, segundo a
caracterstica daquilo que objecto de estudo. Esta caracterstica denominada varivel.

As variveis possuem naturezas diversas, que definem o tipo de descrio e anlise estatstica possveis para
cada uma delas. Podem ser:

a Qualitativa: quando seus valores so expressos por atributos: sexo (masculino feminino), cor da pele
(branca, preta, amarela, vermelha);

b Quantitativa: quando seus valores so expressos em nmeros (salrios dos operrios, idade dos alunos de
uma escola, nmero de filhos, etc.). Uma varivel quantitativa que pode assumir, teoricamente, qualquer valor
entre dois limites recebe o nome de varivel contnua (altura, peso, etc.); uma varivel que s pode assumir
valores pertencentes a um conjunto enumervel recebe o nome de varivel discreta (nmero de filhos, nmero
de vitrias).

Na bioestatistica, caracterizamos, ainda, as variveis segundo a sua capacidade paramtrica e o seu nivel de
mensurao:

No-paramtricas: podemos observar a distribuio das observaes em cada uma das categorias ou
modalidades desta varivel. As variveis no-paramtricas so subdivididas em:
Escala nominal quando cada categoria da varivel recebe um nome e no h hierarquia entre elas e quando o
seu significado s se entende em funo do nome e o nmero ou cdigo que se lhe atribua no nos d nenhuma
informao (sexo, cor de olhos, grau de parentesco, tipo de patologia, presena/ausncia de factores de risco,
etc.). Para estas variveis no se pode estabelecer operaes matemticas, ou seja, uma anlise para comparar
os indivduos por gnero e cor de olhos no permite que somar as cores de olhos e dividir por sexo.
Escala ordinal - quando existe uma ordenao possivel (gravidade de uma leso, classe social, grau de
escolaridade, etc.), isto , quando alm da classificao numa determinada categoria, pode-se estabelecer uma
graduao entre elas. Para estas variveis valem apenas as operaes de maior que e menor que.

Paramtricas: as observaes so quantificveis. estas variveis so quantitativas e podem ser nomeadas,


ordenadas e conhecer o valor exacto da diferena entre as observaes. As variveis paramtricas so
subdivididas em:
Escala intervalar: quando se sabe qual a diferena exacta entre as observaes, mas no existe um zero real.
Ex.: a diferena entre 10oC e 30oC a mesma que entre 70oC e 90oC, ou seja, 20oC. Mas no posso dizer que
10oC 1/3 do calor de 30oC, nem que 0 ausncia de calor.
Escala de razes: quando possvel fixar um zero de forma no arbitrria, poderei aplicar todas as operaes
aritmticas. Ex: Idade dos indivduos. Posso dizer que um indivduo de 60 anos tem o dobro da idade de um
indivduo de 30 anos e que zero mortes por ingesto de laranjas ausncia de mortes derivadas do consumo de
laranjas. A principal diferenciao para variveis em escala de razes quanto a serem:
Contnuas: quando no se obtm um valor exato, mas sim aproximado. Os valores possveis esto no conjunto
dos nmeros reais, podendo haver valores fraccionrios. Ex: peso, altura, concentrao de flor na gua. No
existe um instrumento de medida preciso o suficiente para determinar o valor exato, sendo mensurveis.
Discretas: quando enumerveis ou contveis. Os valores possveis esto no conjunto de nmeros inteiros. Ex:
nmero de filhos, nmero de carros, nmero de bitos. possvel definir o nmero exato de ocorrncias, sendo
contveis.

Quanto s variveis, convm ainda lembrar que de uma escala de determinado nvel pode-se passar para um
nvel anterior, com o risco de se perder a preciso da informao, mas o contrrio no possvel. Ex: Quando
tenho o rendimento individual de uma populao tenho uma escala de razo, podendo realizar todas as
operaes aritmticas. Posso transformar esta informao em escala ordinal, classificando os indivduos em

41
Estatistica e Bioestatstica
2014
rendimento baixo, mdio e elevado. Se a informao fosse recolhida na escala ordinal (alto, mdio, baixo), no
seria possvel definir o rendimento mdio individual.

Tendo em conta o nmero de atributos (caractersticas) que esto a ser estudadas, as variveis podem ser:

Unidimensionais: se apenas corresponde a um atributo

Bidimensionais: se corresponde a dois atributos;

Pluridimensionais: se corresponde a vrios atributos.

Modalidade: toda a manifestao possvel de uma varivel, isto , as vrias hipteses de resposta, podendo
elas ser duas ou mais.

As modalidades tm obrigatoriamente que ser:

Incompatveis: cada unidade Estatstica no pode pertencer simultaneamente a duas ou mais modalidades;

Exaustivas: todas as unidades Estatsticas tm que ser inseridas numa modalidade.

A escolha das modalidades deve ser feita de acordo com as informaes possudas. No entanto, surgem
situaes em que h necessidade de se aumentar uma modalidade suplementar.

Exerccios

Classifique as variveis abaixo:

Tempo para fazer um teste


Nmero de alunos aprovados por turma
Nvel scio-econmico
QI (Quociente de inteligncia)
Sexo
Gastos com alimentao
Opinio com relao pena de morte
Religio
Valor de um imvel
Conceitos em certa disciplina
Classificao em um concurso
Imveis
Sabores
Quantidade de sabores de refresco consumida
em determinado estabelecimentoe periodo

5.3 Parmetro e dado estatstico

O parmetro toda a funo definida a partir dos dados numricos de uma populao.
Exemplo: consideremos as seguintes notas em Estatstica - 10 11 10 15 9
Mdia =xi/n = 55/5 = 11
O valor 11 o parmetro (resultado da mdia aritmtica).

O dado estatstico toda a funo definida a partir dos dados numricos de uma amostra.
Exemplo: consideremos a amostra: 10 10
Mdia =xi/n = 20/2 = 10 O valor 10 o dado estatstico

42
Estatistica e Bioestatstica
2014
5.4 Representao de uma varivel estatstica

Depois de termos definido algumas noes bsicas de estatstica, tratar-se-, a seguir, da segunda fase de um
estudo estatstico. Como j referimos, os dados numricos recolhidos registam-se em sries estatsticas e, para
serem analisados, devem ser ordenados e representados em quadros e em grficos.

Quando trabalhamos com uma varivel discreta ou descontnua falamos em seriao e quando trabalhamos
com uma varivel contnua falamos em classificao.

Seriao de uma amostra

Como j referimos anteriormente, uma seriao implica que a varivel seja discreta (exemplo: nmero de filhos
de um casal, nmero de divises de uma casa, etc.).

O quadro geral de uma seriao est expresso no quadro que se segue.

TABELA 5: QUADRO GERAL DE SERIO


Varivel Frequncias Frequncias Frequncias Frequncias
absolutas acumuladas relativas relativas
acumuladas
X1 n1 n1 n1 n1
N N
X2 n2 n1+ n2 n2 n1+n2
N N
X3 n3 n1+ n2+ n3 n3 n1+ n2+n3
N N

Xi ni n1+ n2+ +ni ni n1+ n2++ ni
N N

Xk nk n1+ n2+ +nk nk 1
N
Total N 1
Legenda: Distribuio de frequncias de uma varivel discreta

Na primeira coluna temos os valores que a nossa varivel X toma (x1, x2, ..., xk). Esta coluna pode ser tambm
denominada por xi.

Na segunda coluna apresentamos as frequncias absolutas simples ou efectivas, isto , o nmero de vezes que
cada valor foi observado ou o nmero de vezes que cada valor surge na amostra. Esta coluna pode tambm ser
denominada por ni. Devemos lembrar aqui que o nmero total de indivduos pertencentes populao/ou
amostra chama-se efectivo total e designa-se por n, devendo sempre verificar-se que ni = n.

Na terceira coluna podemos visualizar as frequncias acumuladas, isto , a soma das frequncias absolutas
correspondentes a valores inferiores a um determinado valor. Esta coluna pode ser tambm denominada por
N(xi). Assim,

N(xi) = ni
xi<x

43
Estatistica e Bioestatstica
2014
Na quarta coluna apresentamos as frequncias relativas simples. Esta coluna pode ser tambm denominada por
fi, em que fi = ni/n e, de tal modo que, fi = 1; a frequncia relativa expressa, em geral, em percentagem.

Na quinta coluna temos as frequncias relativas acumuladas, isto , a soma das frequncias relativas
correspondentes a valores inferiores a um determinado valor. Esta coluna pode ser tambm denominada por
F(xi); a frequncia relativa acumulada expressa, em geral, em percentagem.

Exemplo: Construa o quadro de frequncias para a varivel X que toma os seguintes valores:

xi 14 14 13 12 11 12 10 13 12

TABELA 6 FREQUNCIAS
xi ni fi=ni/n N(xi) F(xi)
10 1 1/9 1 1/9
11 1 1/9 2 2/9
12 3 3/9 5 5/9
13 2 2/9 7 7/9
14 2 2/9 9 9/9
ni = 9 fi = 1 em que n = 9

Classificao de uma amostra

Como j referimos anteriormente, uma classificao implica que a varivel seja contnua (exemplo: a
temperatura de um corpo, a altura de uma pessoa, a durao de certo fenmeno, etc. - variveis relacionadas
com o espao, o tempo ou a massa).

TABELA 7 FREQUNCIAS
Classes Marcas da Frequncias Frequncias Frequncias Frequncias
classe absolutas acumuladas relativas relativas
acumuladas

c0-c1 X1 n1 n1 n1 n1
N N
c1-c2 X2 n2 n1+ n2 n2 n1+n2
N N
c2-c3 X3 n3 n1+ n2+ n3 n3 n1+ n2+n3
N N

ci-1-ci Xi ni n1+ n2+ +ni ni n1+ n2++ ni
N N

ci-1-ck Xk nk n1+ n2+ +nk nk 1
N
Total _ 1
Legenda: Distribuio de frequncias de uma varivel contnua

Na primeira coluna temos as classes. Por conveno, as classes so abertas superiormente, com excepo da
ltima classe, naturalmente.

44
Estatistica e Bioestatstica
2014
Na segunda coluna temos as marcas da classe. Esta coluna pode ser tambm designada por x'i. A marca de uma
classe o ponto mdio dessa classe, ou seja, o ponto equidistante dos extremos de uma classe.

Exemplo: classe c0-c1 x'1 = (c0 + c1) / 2

Na terceira coluna apresentamos as frequncias absolutas simples ou efectivas, ou seja, o nmero de vezes que
os valores de determinada classe foram observados. Esta coluna pode ser tambm denominada por ni. Mais
uma vez, ni = n (nmero total de indivduos pertencentes populao/ou amostra, a que se chama efectivo
total).

Na quarta coluna apresentamos as frequncias acumuladas, isto , a soma das frequncias absolutas
correspondentes a valores inferiores a um determinado valor. Esta coluna pode ser tambm denominada por
N(i).

Na quinta coluna temos as frequncias relativas simples. Esta coluna pode ser tambm denominada por fi, em
que fi = ni/n e, de tal modo, que fi =1.

Na sexta coluna apresentamos as frequncias relativas acumuladas, isto , a soma das frequncias relativas
correspondentes a valores inferiores a um determinado valor. Esta coluna pode ser tambm denominada por F(
i).

Numa classificao habitual representarmos por K o nmero de classes (em geral K varia entre 5 e 20,
inclusive) e por A a amplitude (em que A=x mximo - x mnimo).

Ento,

- Se K dado = A/K

- Se dado K=A/ , sendo a amplitude do intervalo de


classe e A a amplitude do intervalo

da amostra

Exemplo: Construa o quadro de frequncias com os seguintes dados:

Classes [20-23[ [23-26[ [26-29[ [29-32[ [32-35[ [35-38]

ni 2 5 7 10 4 2

TABELA 8 FREQUNCIAS
Classes ni fi N(i) F(i) x'i

[20-22] 2 2/30 2 2/30 21


[23-25] 5 5/30 7 7/30 24
[26-28] 7 7/30 14 14/30 27
[29-31] 10 10/30 24 24/30 30
[32-34] 4 4/30 28 28/30 33
[35-38] 2 2/30 30 30/30 36
ni = 30 fi = 1 em que n = 30 e = 3

45
Estatistica e Bioestatstica
2014

5.5 Reduo de uma varivel estatstica

5.5.1 Conceito de reduo e sua convenincia


Anteriormente definimos o conceito de varivel estatstica e construram-se quadros e grficos estatsticos com
vista a uma descrio numrica e grfica de uma varivel estatstica. Naturalmente, os grficos permitem uma
primeira sntese das informaes registadas nos quadros.

Por outro lado, por simples aproximao das curvas de frequncias absolutas ou relativas de duas ou mais
variveis, podemos fazer uma primeira comparao entre elas.

H, porm, necessidade de sintetizarmos toda a informao respeitante a uma varivel estatstica, resumindo-se
os dados a um pequeno nmero de elementos que bastam para caracteriz-la. Tal sntese consiste na reduo
de dados e os elementos numricos obtidos designam-se por parmetros da varivel estatstica.

Feita a representao dos dados estatsticos por meio de quadros e/ou de grficos, importa fazer sobre os
mesmos um estudo no sentido de se poder chegar a concluses.

Para tal, impe-se um trabalho de simplificao que consiste em proceder a snteses, em reduzir grandes
quantidades de dados a nmeros simples que permitam uma anlise rpida e uma fcil comparao com outras
sries da mesma natureza ou de natureza diferente.

Tais nmeros so designados, habitualmente, por caractersticas, parmetros ou medidas e so agrupados em


categorias conforme o tipo de informao que fornecem.

6. Medidas de Tendencia Central

Sob esta designao agrupam-se os parmetros que, ou nos indicam algo de associvel ao ncleo ou centro da
distribuio, ou nos permitem compartiment-la. Vamos considerar as seguintes medidas de tendncia central
ou de posio: mdia, mediana, moda e separatrizes ou quantis.

6.1 Mdia aritmtica

A mdia aritmtica simples

A mdia aritmtica simples de um conjunto de valores o valor obtido somando-se todos eles e dividindo-se o
total pelo nmero de valores. denotada por x (leia-se x barra)

x
x , onde x so os valores observados.
n

x
x .fi i
, se os dados estiverem organizados em distribuio de frequncia.
f i

Onde xi e fi so os valores do ponto mdio e da frequncia absoluta da classe i-sima respectivamente.

46
Estatistica e Bioestatstica
2014
Exerccios:

3.8.1 - E1:
Calcule a mdia aritmtica dos valores abaixo:

X = {0, 6, 8, 7, 4, 6}

Y = {25, 16, 29, 19, 17}

Z = {105, 123, 98, 140}

3.8.1 E2:
Encontre a mdia para o colesterol destes sujeitos.

TABELA 9
Colesterol fi

140 |-- 160 7


160 |-- 180 20
180 |-- 200 33
200 |-- 220 25
220 |-- 240 11
240 |-- 260 4
100

3.8.1 E3:
Encontre a mdia dos seguintes conjuntos de observaes.

X = {2, 3, 7, 8, 9} Y = {10, 15, 22, 18, 25, 16}

Z = {1, 3, 6, 8} T = {1, 3, 6, 100}

3.8.1 E4:
Encontre a mdia das notas obtidas no mdulo terico da disciplina de bioestatistica.

TABELA 10
notas fi

5 |-- 6 18
6 |-- 7 17
7 |-- 8 12
8 |-- 9 3
9 |-- 10 2
50

47
Estatistica e Bioestatstica
2014
3.8.1 E5:
Calcule a mdia aritmtica, sabendo que

Idade da 1. vacina 4 6 7 8 10

n 2 4 5 3 2

3.8.1 E6:
Calcule a mdia aritmtica do numero de trabalhos de MIB que foram enviados para reformulao nos ltimos
5 anos, na globalidade dos cursos, sabendo que

notas [3-5[ [5-7[ [7-9[ [9-11[ [11-13]

fi 2 4 5 3 2

Relativamente s propriedades da mdia aritmtica podemos enunciar duas:

Somando ou subtraindo uma constante a todos os valores observados, a mdia resultante ficar aumentada ou
diminuda, respectivamente, dessa constante;
Multiplicando ou dividindo os valores observados por uma constante diferente de zero, a mdia resultante
ficar multiplicada ou dividida, respectivamente, por essa constante.

6.2 Mdia Ponderada:


Por sua vez associa-se a x1, x2, ..., xk certos factores de ponderao ou pesos p1, p2, ..., pk que dependem do
significado ou importncia atribuda s observaes. Assim, a frmula matemtica da mdia ser:

x p = pixi / pi

Exemplo 9: Um professor de matemtica quer saber a mdia poderada das suas avaliaes nas quatro turmas
em que lecciona, sabendo que o teste tinha uma ponderao de 30% e o trabalho uma ponderao de 70%:
Turma A - Mdia da nota do teste =65% Mdia da nota do trabalho =78%
Turma B - Mdia da nota do teste =60% Mdia da nota do trabalho =70%
Turma C - Mdia da nota do teste =40% Mdia da nota do trabalho =28%
Turma D Mdia da nota do teste =80% Mdia da nota do trabalho =75%
Determine a mdia ponderada das quatro turmas em conjunto.
xp=pixi/pi = [((65*30)/100) + ((78*70)/100) + ((60*30)/100) + ((70*70)/100) + ((40*30)/100) +
((28*70)/100) + ((80*30)/100) + ((75*70)/100)]/4 = 62,3

Se preferirmos em quadro a resoluo ser

TABELA 11
xi pi pixi

65 30 1950
60 30 1800
40 30 1200
80 30 2400
78 70 5460
70 70 4900
28 70 1960
75 70 5250
400 24920

48
Estatistica e Bioestatstica
2014
x p = pixi / pi=24920/400=62,3

Para alm da mdia aritmtica e da mdia aritmtica ponderada, temos tambm a mdia geomtrica, a mdia
harmnica e a mdia quadrtrica (a estes trs tipos de mdias no iremos fazer qualquer referncia).

6.3 Mediana

A mediana de uma srie de n observaes x1, x2, ..., xn de uma varivel X o valor que ocupa a posio central
quando as observaes esto ordenadas por ordem crescente ou decrescente, isto , a mediana de uma varivel
estatstica o valor dessa varivel tal que a frequncia dos valores que lhe so inferiores a mesma que a
frequncia dos valores que lhe so superiores. Representa-se, habitualmente, por Md.

A mediana usada quando na amostra h valores excntricos em relao a outros valores.

Para o clculo da mediana, temos de considerar duas situaes: o caso em que N mpar e o caso em que N
par.

Conceptualizando de uma outra forma:

MEDIANA Md - o valor que divide a distribuio em duas partes iguais, tendo portanto, tantos valores
sua direita quais a esquerda.

50% 50%

Md

.- Para facilitarmos a obteno o valor da mediana, descreveremos a seguir o procedimento para a obteno
sua obteno passo a passo.

3.1.7.1 - Para dados no agrupados

1 Passo - Ordenar as observaes

2 Passo - Verificar de o nmero for mpar ou par. (n)

- Se o nmero de observaes for mpar o valor da mediana ser o valor da observao que ocupar a posio

- Se o nmero de observaes for par a mediana ser igual a mdia aritmtica dos valores que ocuparem as
posies P1 e P2, onde:

Obs.: n = nmero de observaes.

49
Estatistica e Bioestatstica
2014
Para uma distribuio de frequncias por valores.

1 Passo - Construir na tabela uma coluna com as Fi

2 Passo - Verificar se o nmero de observaes N (fi) par ou mpar:

- Se o nmero de observaes for mpar com o auxilio da coluna das Fiabaixo verificaremos a mediana que
ser o valor que ocupar a posio

- Se o nmero de observaes for par com o auxilio da coluna das fiabaixo verificar qual os valores que
ocupam as posies:

A mediana ser obtida atravs da mdia aritmtica com valores que ocuparem as posies P1 e P2 .

Assim se:

6.3.1. N mpar:
A mediana um valor observado, de tal modo que o lugar que ocupa dado pela frmula

Md = (N +1) / 2

Exemplo: mediana para a seguinte srie de dados

5 9 8 7 6

Ordenando por ordem crescente, vem 5 6 7 8 9

Como N mpar, ento Md=(N+1) / 2 = (5+1) / 2 = 6/2 = 3

Se a mediana ocupa a terceira posio ou terceiro termo, o seu valor 7

Mas se:

6.3.2. N par:

A mediana no coincide com nenhum valor observado ficando compreendida entre dois valores centrais - classe
mediana; convencionou-se tomar para mediana a mdia destes dois valores. A posio que a mediana ocupa
dada pela frmula

Md = mdia dos valores que se encontram na posio N / 2 e (N / 2) + 1

Exemplo: mediana para a seguinte srie de dados

5 6 12 9 8 7

Ordenando por ordem crescente, vem 5 6 7 8 9 12

50
Estatistica e Bioestatstica
2014
Como N par, ento N/2 = 6/2 = 3 ; ( N/2 + 1) = 3+1 = 4

Assim, a classe mediana ocupada pelas posies 3 e 4, ou seja, pelos valores 7 e 8, pelo que a Md = (7+8) / 2
= 15/2 = 7,5

3.1.7.3 Para uma Distribuio de Frequncias por Classes de Valores.

1 Passo Construir na distribuio uma coluna contendo as frequncias absolutas acumulada abaixo de
com a finalidade de auxiliar a localizao do valor que ocupa a posio P que ser utilizada no clculo da
mediana.

2 Passo Posio da mediana

P = N/2

3 Passo Com o auxlio da Fi abaixo localizaremos a classe que contm a mediana.

4 Passo Clculo da mediana

O valor da mediana ser obtido atravs da seguinte expresso:

onde:

Md = mediana

li = limite inferior da classe que contm a mediana

P = posio da mediana

Fant = frequncia absoluta acumulada abaixo de da classe anterior classe que contm a mediana

hi = Amplitude do intervalo de classes da classe que contm a mediana

fi = Frequncia simples absoluta da classe que contm a mediana.

3.1.7.4 Exemplos

a) - : Calcule a mediana para os seguintes conjuntos de observaes:

5,6,7,1,2,2,2,3,4,2,9

1,2,2,2,2,3,4,5,6,7,9 - n=11 (impar) P = (n+1)/2= (11+1)/2= 6 termo Md = 3

b)-Calcule a mediana para o seguinte conjunto de observaes 4,5,10,20,13,9,9,8,7,6,5,8,8,10

4,5,5,6,7,8,8,8,9,9,10,10,13,20 n=14 (par)

P1= N/2= 14/2 = 7 termo e P2 = N/2+ 1 = 14/2 + 1 = 7 +1 = 8 termo

md = (8 + 8)/2 = 16/2 = 8 md = 8

51
Estatistica e Bioestatstica
2014

c) Calcule a mediana para os seguintes conjuntos de observaes


2,3,4,0,9,8,7,6,5,6
0,2,3,4,5,6,6,7,8,9 n=10 (par)
P1=N/2 = 10/2 = 5 termo e P2 = N/2 +1 = 10/2 + 1 = 6 termo
Md = (5 + 6)/2 = 11/2 = 5,5 md = 5,5

d) Exemplo: Calcule a mediana para a seguinte distribuio:


xi fi Fi abaixo
0 100 100
1 80 180
2 61 241
3 40 281
4 10 281
5 10 301
301 -
N = fi = 301 (impar) - P = (N+1)/2 = (301 + 1)/2 = 302/2 = 151 termo Md=1
e) Exemplo: Calculo da mediana:
xi fi Fi abaixo
10 2 2
11 8 10
12 10 20
13 45 65
14 60 125
15 80 205
16 95 300
300 -
N = fi = 300 (par)
P1+ N/2 = 300/2 = 150 termo e P2=(N + 1)/2 = 300 + 1 = 151 termo
md = (15 + 15)/2 = 30/2 = 15 md = 15

f) -Exemplo: Calcule a mediana:

xi fi Fi abaixo
10 2 2
11 8 10
12 10 20
13 45 65
14 60 125
15 80 205
16 45 -
250 -

N = fi = 250 (par)

P1= N/2 = 250/2 = 125 termo e P2= N/2 + 1 = 250/2 + 1 = 126 termo

md = (14 + 15)/2 = 29 = 14,5 md = 14,5

52
Estatistica e Bioestatstica
2014
g) Exemplo: Calcule a mediana para a seguinte distribuio:

classes fi Fi
0 10 2 2
10 20 8 10
20 30 20 30
30 40 50 80
40 50 60 140
50 60 80 220
60 70 45 286
286 -

P =N/2 = 286/2 = 143 Md = 50 + (143 140 ) x ((60 50)/80) Md = 50 + 30/80


Md = 50 + 0, 38 Md = 50,38

6.4 Moda ou Norma - Mo


o valor ou valores que ocorrem maior nmero de vezes em um levantamento estatstico, ou seja o(s)
valor(es) de maior frequncia.

3.1.6.1 - Para Dados No Agrupados - Basta verificarmos qual ou quais os valores de maior ocorrncia.
Exemplo: Sejam as observaes: 2,2 3,3,3, 4,4,4,4,4,5,5,5,5,5.

Os valores da Moda sero 4 e 5 pois cada um deles ocorreu 4 vezes.

3.1.6.2 - Para uma Distribuio de Frequncias por Valores - Quando tivermos uma distribuio de
frequncias por valores a moda ser o valor ou valores que possuir(em) a maior frequncia simples absoluta.

3.1.6.3 - Para uma Distribuio de Frequncias por Classes de Valores - Para uma distribuio de frequncias
por classes temos 3 opes:

3.1.6.3.1 - Moda bruta - o ponto mdio da classe de maior frequncia.

3.1.6.3.2 - Moda de Czuber - Ser obtida pela expresso:

Onde:

Mo = Moda

li = Limite inferior da classe modal(classe de maior frequncia)

h = Amplitude do intervalo de classe da classe modal

fmax = Maior frequncia simples absoluta, ou seja, frequncia simples absoluta da classe modal.

fant = Frequncia simples absoluta da classe anterior a classe modal (classe modal onde se localiza a moda)

fpost = Frequncia simples absoluta da classe posterior a classe modal

Classe modal = Classe de maior frequncia = Classe onde se localiza a moda.

53
Estatistica e Bioestatstica
2014

3.1.6.4 - Exerccios: Determine o valor da moda para cada uma das seguintes distribuies:

I- II -

Graus Nmero de alunos Graus Nmero de alunos


2 15 0 2 20
3 4 2 4 46
4 30 4 6 51
5 39 6 8 47
6 41 8 10 16
7 20
8 10
195 180

III -

Idades Nmero de alunos


15 25 12
25 35 40
35 45 41
45 55 10
55 65 4
65 75 1
108

6.5 Separatrizes ou Quantis

Em algumas situaes ao invs de termos a necessidade de uma medida que represente o grupo como um todo,
estamos interessados principalmente na posio ocupada pelo indivduo em relao ao grupo ou de uma
determinada observao em relao a um conjunto de observaes de modo a interpretar o seu resultado..

Por exemplo se um indivduo em determinado exame obteve grau cinco. Uma melhor avaliao de seu
desempenho serie se pudssemos estabelecer a sua

Em algumas situaes ao invs de termos a necessidade de uma medida que represente o grupo como um todo,
estamos interessados principalmente na posio ocupada pelo indivduo em relao ao grupo ou de uma
determinada observao em relao a um conjunto de observaes de modo a interpretar o seu resultado..

Por exemplo se um indivduo em determinado exame obteve grau cinco. Uma melhor avaliao de seu
desempenho serie se pudssemos estabelecer a sua performance em relao ao total, determinando a sua
posio em relao as demais notas obtidas pelo grupo em tal avaliao.

Se o salrio pago a uma determinada categoria funcionalnumaempresa.

Um funcionrio da referida categoria pode avaliar a sua importncia diante de grupo se atravs de uma
medida de posio conseguir comparar os seus proventos em relao ao grupo em si. Tal procedimento pode
ser verificado utilizando-se o clculo de uma separatriz.

54
Estatistica e Bioestatstica
2014
A eficcia de um tipo de tratamento, seria melhor avaliada se pudssemos comparar a sua
performance comparada aos indivduos que no o fizeram ou junto aos que utilizaram outro mtodo de
tratamento.

Separatrizes podemos definir como sendo nmeros que dividem uma seqncia de dados ou uma
distribuio de dados em partes que contm a mesma quantidade de elementos da srie ou da distribuio.

Como vimos anteriormente a mediana era um valor que dividia uma srie ou uma distribuio em duas
partes iguais .

As separatrizes mais importantes so os Quartis, os Kintis, os Decis e os Percentis.

Ao calcularmos o valor de uma separatriz podemos dividir uma distribuio em duas partes quaisquer
como poderemos observar ao longo da explanao que ora se inicia, da alguns autores usarem como definio
de Separatriz como sendo um valor que divide uma distribuio em duas partes quaisquer.

As Separatrizes mais utilizadas so:

-Quartis Qi

-Kintis Ki

-Decis Di

-Percentis Pi

3.2.1 - Quartis So 3 valores que dividem uma distribuio em 4 partes iguais

QUARTIS- Qi 1 quartil 2 quartil

25% 25% 25% 25% 25% 75% 50% 50%

Q1 Q2 .Q3 Q1 Q2

Como podemos observar ao calcularmos determinando o valor do primeiro quartil sabemos que 25% das
observaes ficaro abaixo do valor determinado e setenta e cinco por cento ficar acima do valor calculado.

Ao calcularmos o valor do segundo quartil poderemos afirmar que 50% das observaes ficaro abaixo do
valor do segundo quartil e a outra metade consequentemente ficar acima do valor determinado.. Da
afirmarmos que sempre o valor do segundo quartil ser igual ao valor da mediana exatamente pelofactodeles
ocuparem a mesma posio.

Ao calcularmos o valor do terceiro quartil afirmamos que 75% das observaes ficaro abaixo de tal valor e
25% consequentemente ficaro acima do valor calculado.

55
Estatistica e Bioestatstica
2014

3.2.2 - Kintis So 4 valores que dividem uma distribuio em 5 partes iguais

Ao calcularmos o valor do primeiro Kintil podemos afirmar que 20% das observaes estaro abaixo do seu
valor e consequentemente 80% das observaes estaro acima do referido valor.

KINTIS Ki 1 kintil 2 kintil

20% 20% 20% 20% 20% 20% 80% 40% 60%

K1 K2 K3 K4 K1 K2

3.2.3 - Decis So 9 valores que dividem uma distribuio em 10 partes iguais

Di

10% 10% 10% 10% 10% 10% 10% 10% 10% 10%

D1 D2 D3 D4 D5 D6 D7 D8 D9

1 decil 2 decil

10% 90% 20% 80%

D1 D2

3.2.4 - Percentis So 99 valores que dividem uma distribuio em 100 partes iguais

Pi 17 percentil 25 percentil

17% 83% 25% 75%

P17 P25

56
Estatistica e Bioestatstica
2014

3.2.5 - Procedimento para o Clculo de uma Separatriz

1 Passo: Construir uma coluna contendo as frequncias absoluta acumulada abaixo de com a finalidade de
localizar a classe que contm a separatriz desejada.

2 Passo Posio da separatriz:

Quartis Kintis Decis Percentis

P= iN/4 P= i.N/5 P= i.N/10 P= (i.N) /100

Onde i = nmero da separatriz desejada:

Exemplo:

No 1 quartil i = 1 No 95 percentil i = 95 No3 quartil i = 3

No 3 kintil i = 3 No 4 decil i = 4 47 percentil i = 47

3 Passo: Com o auxlio das Fi abaixo, localizaremos a classe que contm a separatriz desejada.

4 Passo: Calculo da separatriz desejada o valor da separatriz ser obtido atravs da seguinte expresso:

S = li + (P Fi abaixo ) .* hi

fi

Onde: S = (Qi, Ki, Di, Pi) = Separatriz

li = limite inferior da classe que contm a separatriz

P = posio da separatriz

Fi abaixo = frequncia absoluta acumulada abaixo de da classe anterior a que contm a separatriz

hi Amplitude do intervalo de classes da classe que contm a separatiz

fi Frequncia simples absoluta da classe que contm a separatriz.

57
Estatistica e Bioestatstica
2014

3.2.6 - Exerccios

3.2.6.1 Com os dados da distribuio de idades dos pacientes do hospital X

Classes (idades) fi (n de pacientes) Fi abaixo


0 10 20 20
10 20 50 70
20 30 100 170
30 40 150 320
40 50 145 465
50 60 85 550
60 70 50 600
600 -

determine:

a) O 1 quartil b) O 2 quartil c) O 1 kintil d) O 3 kintil e) O 4 decil f) 35 percentil.

a) P = i.N/4 P=(1. 600)/4 = 150

Q1 = 20 + (150 70)/100 .(30 20) Q1 = 20 + (80/100).10 1 = 20 + 800/100

Q1 = 20 + 8 = 28

25% 75%

Q1 = 28

3.2.6.2 - Exerccio sobre de Separatrizes com Resposta

1) A tabela abaixo apresenta os salrios dos funcionrios da clnica X. Sabe-se que a composio dos salrios
d-se atravs de 1 valor fixo + comisses.(assiduidade, produtividade, etc..)

SALRIOS (em R$) N de FUNCIONRIOS (fi) Fiabaixo


250 500 8 8
500 750 25 33
750 1000 40 73
1000 1250 37 110
1250 1500 20 130
1500 1750 10 140
1750 2000 8 148
2000 4000 2 150
................... 150 -

a) Se o empregador deseja fornecer uma cesta bsica a 15% dos funcionrios de pior desempenho, qual dever
ser o maior salrio a fazer a referida cesta ?

58
Estatistica e Bioestatstica
2014
22,5 8
15% de 150 = 22,5 ::: x = 500 + . 250 = R$ 645,00
25

b) Se ele deseja a ttulo de prmio conceder 15% de aumento (no salrio fixo) a 10% dos funcionrios de
melhor desempenho. Qual o valor que ele deve estipular ?

135 130
x = 1500 + . 250 = R$ 1625,00.
10

Quem ganha mais que R$ 1625,00, ganhar os 15% de aumento de prmio.

2) A tabela abaixo apresenta a durao das peas produzidas pela CIA X a partir de observao em 1000 peas
aleatoriamente selecionadas. Suponha que o fabricante deseja colocar nos meios de comunicao de uma
propaganda, sobre a durao da pea, informando aos consumidores que as mesmas sero trocadas caso no
seja atingida o n mnimo de horas estipuladas. Qual dever ser a vida mnima da pea a ser veiculada na
propaganda se ele deseja repor somente 12% das peas comercializadas.

VIDA TIL (horas) N de PEAS (fi) Fiabaixo


0 1000 20 20
1000 2000 40 60
2000 3000 80 140
3000 4000 260 400
4000 6000 360 760
6000 7000 220 980
7000 10000 20 1000
................... 1000 -
Resposta: P12

7. Medidas de Disperso ou Variabilidade

Ao estudarmos medidas de tendncia central conclumos que elas no so de modo algum suficientes
quando desejamos caracterizar um conjunto de observaes estando eles apresentados em seqncia e at
mesmo como distribuio.

Vejamos o exemplo dado em classe ao imaginarmos dois grupos de seis funcionrios que foram
submetidos a um mesmo teste de aptido e ao final verificamos que a mdia do primeiro grupo, GRUPO I, era 5
e a mdia do segundo grupo ,GRUPOII tambm era 5.Ofactodas mdias obtidas pelos grupos ser a mesma no
significa obrigatoriamente que eles sejam iguais. Vejamos os graus obtidos pelos componentes de cada grupo.

GRUPOI : 2;2;2;8;8;8; GRUPOII : 5;5;5;5;5;5

Ao observarmos os grupo verificamos que a mdia aritmtica do grupo no se identifica com nenhuma das
observaes ou seja no representaria nenhuma delas.. Ao passo que a mdia obtida pelos componentes do
grupoII representa e muito as avaliaes obtidas pelo grupo.

59
Estatistica e Bioestatstica
2014
Um outro exemplo seria. Considere as seguintes avaliaes para os cinco grupos abaixo:

GRUPOI : 1;2;3;4;5;5;6;7;8;9 Mdia = 5 Moda= 5 Mediana=5

GRUPOII : 1;2;3;5;5;5;5;7;8;9 Mdia = 5 Moda= 5 Mediana=5

GRUPOIII : 2;2;3;5;5;5;5;7;8;8 Mdia = 5 Moda= 5 Mediana=5

GRUPOIII : 3;3;4;5;5;5;5;6;7;7 Mdia = 5 Moda= 5 Mediana=5

GRUPOIV : 5;5;5;5;5;5;5;5;5;5 Mdia = 5 Moda= 5 Mediana=5

O exemplo acima vem a corroborar ao que relatamos, ou seja apesar dos quatro grupos apresentarem
os mesmos valores para a mdia, para a mediana e para a moda, podemos afirmar ao observarmos que existe
muita diferenas , com muita discrepncia entre eles.

Ao avali-los como temos somente 10 observaes podemos concluir que o grupo IV o mais homogneo e o
grupo I o mais heterogneo. Mas tal concluso somente nos foi possvel em virtude de estarmos analisando um
nmero reduzido de observaes.

Se o captulo anterior estudou-se as medidas de posio, capazes de representar os valores de uma srie
estatstica, conclumos que essas medidas no so suficientes para caracterizar uma srie. Assim, h
necessidade de estudar outras medidas que identifiquem a variabilidade ( disperso ou desvios ) entre os
valores da srie. Para isso, so usadas as medidas de variabilidade, que sero vistas nesse tpico..

As principais medidas de disperso absolutas so: Amplitude Total; Varincia ; Desvio Padro; e Desvio
Quartlico

4.1 - AMPLITUDE TOTAL- At Corresponde a diferena entre o maior e o menor valor observado na srie.

Exemplo: Seja a srie: X = { 10 6 9 5 5 4 3 }.

At = 10 - 3 = 7.

4.2 - VARINCIA (2)

A varincia de uma srie de valores definida como a mdia dos quadrados dos desvios ( ou afastamentos )
desses valores em relao a sua mdia aritmtica ou ainda como o quadrado do desvio padro.

4.3 - DESVIO PADRO ( )

O desvio padro de uma srie de valores pode ser definida como a raiz quadrada positiva da varincia desses
valores.

O desvio padro a medida de variabilidade absoluta mais importante pois mede a homogeneidade dos valores
da srie ou seja, a disperso mdia desses valores em relao a sua mdia aritmtica.

Pelas prprias definies, h que se calcular primeiramente a varincia e a partir desta, obter o desvio
padro aplicando-se a raiz quadrada.

60
Estatistica e Bioestatstica
2014
OBS. Nesta parte da matria, Estatstica Descritiva, vamos considerar sempre os dados obtidos de
populao e, portanto, nas frmulas de clculo da varincia e do desvio padro, ser utilizado o denominador (
N ).

4.4 CLCULO DA VARINCIA 2

4.4.1 - Primeiro Caso - Para Dados no Agrupados ou seja para as sries simples de valores. - Neste caso tem-
se as seguintes frmulas da varincia e desvio padro:

Frmulas: 2 = [ ( Xi - Ma )2 ] / fi ; = (2 )1/2 e Ma = (Xi ) / fi

Ma = mdia aritmtica

Exemplo: Calcular a varincia e desvio padro para: X = { 9 3 8 12 10 }.

Tabela de clculo.

X _ _
(X - X ) (X - X )2
9 +0,6 0,36
3 -5,4 29,16
8 -0,4 0,16
12 3,6 12,96
10 +1,6 2,56
(SOMA)=42 0 45,2
_
Mdia: X = (Xi ) / fi = 42 /5 = 8,4 .

_
Varincia: S2 = (Xi - X )2 / fi = (45,2)/5 = 9,04

Desvio padro: = (2 )1/2 = (9,04)1/2= 3,007

4.4.2 - SEGUNDO CASO - Para os dados apresentados na forma de tabela de distribuio de


_
frequncias por valores. Neste caso, tem-se a seguinte frmula de clculo da varincia: S = (Xi - X )2 / fi
2

_
sendo: X = (fi Xi ) / / fi e / fi = N.

Exemplo: Calcular a varincia e o desvio padro para as idades de uma populao de pessoas,
apresentadas na tabela abaixo.

_ _
Frmulas: S2 = (Xi - X )2 fi / fi ; = (2 )1/2 e X = ( Xi. fi ) / fi.

61
Estatistica e Bioestatstica
2014
Tabela de dados e de clculo

Xi( idades) fi ( (Xi.f i) _ _ _


( Xi- X ) (Xi - X )2 fi .(Xi - X )2
5 8 40 -3,5 12,25 98,00
7 10 70 -1,5 2,50 22,50
8 5 40 -0,5 0,25 1,25
10 10 100 1,5 2,25 22,50
12 5 60 3,5 12,25 61,25
15 2 30 6,5 42,25 84,50
......... 40 340 --- -- 290,00

_
Mdia: X = (FiXi ) / / fi = 340/ 40 = 8,5

_
Varincia: S2 = (Xi - X )2 fi / fi = (290 / 40) = 7,25.

Desvio padro: = (2 )1/2= (7,25)1/2= 2,69.

4.4.3 - TERCEIRO CASO - para os dados apresentados na forma de distribuio de frequncias por classes de
valores. Neste caso, tem-se a seguinte frmula de clculo da varincia.

Frmulas: S2 = (Pmi - Ma)2 / Fi ; S = ( S2)1/2= (Pmi-- Ma)2 fi )/ fi..

Exemplo: Calcular a varincia e o desvio padro para as alturas de uma populao de pessoas, dadas
na tabela abaixo.

Tabela de dados e de clculo.

_ _
Alturas xi fi Pmi Pmi fi X X
(Pmi - )2 fi (Pmi - )2
150 160 5 155 75 462,25 2311,25
160 170 18 165 2970 132,25 2380,50
170 180 42 175 7350 2,25 94,50
180 190 27 185 4995 72,25 1950,75
190 200 8 195 1560 342,25 2738,00
............... 100 - 17650 - 9475,00
_
Mdia: X = (Fi.Pmi ) / fi = (17 650 / 100) = 176,5

_
Varincia: 2 = i (Pmi - X )2 fi / f= 9 475 / 100 = 94,75.

Desvio padro: = (2 )1/2= (94,75)1/2 = 9,73.

62
Estatistica e Bioestatstica
2014
4.5 - Principais Propriedades do Desvio Padro

a) Somando (ou subtraindo) uma mesma quantidade a todos os valores de uma srie, o desvio padro dessa
nova srie ser o mesmo da srie original, ou seja no ser alterado.

Exemplo: Seja a seguinte srie ( X ): X = { 3 3 5 9 10 }.

Somando 4 a cada valor tem-se: Y = { 7 7 9 13 14 }.

_ _
X = (30/ 5) = 6,0 Y = (50/ 5) = 10

TABELA 12 CLCULO;
Srie ( X Srie ( Y )
_ _ _ _
(X - X ) X - X )2 (Y - Y ) (Y - Y )2
(3-6) = -3 9 ( 7- 10)= -3 9
(3-6) = -3 9 ( 7- 10)= -3 9
(5-6) = -1 1 ( 9- 10)= -1 1
(9-6) =+3 9 (13 - 10)= +3 9
(10-6)=+4 16 (14- 10)= 4 16
(SOMA) 44 44
_
Varincia:( X ) Sx = = (Xi - X )2 / fi = (44 / 5) = 8,8
2

Desvio padro ( X ) Sx = Sx2 = 8,8 = 2,966 = 2,97.


_
Varincia ( Y ) Sy = = (Xi - Y )2 / fi = (44 /5) = 8,8.
2

Desvio padro ( Y ) Sy = Sy2 = 8,8 = 2,966 = 2,97.

b) Multiplicando (ou dividindo) todos os valores de uma srie por uma mesma quantidade o desvio padro
dessa nova srie ficar tambm multiplicado (ou dividido) por essa quantidade.
Exemplo: Seja a seguinte srie ( X ): X = { 4 6 8 10 12 }
Multiplicando cada valor por 2 Tem-se: Y = { 8 12 16 20 24 }
_ _
X = (40/5) = 8,0 Y = (80/ 5) = 16,0
Tabela de clculo;
Srie ( X ) Srie ( Y )
_ _ _ _
(X - X ) X - X )2 (Y - Y ) (Y - Y )2
(4-8) = -4 16 ( 8- 16)= -8 64
(6-8) = -2 4 (12- 16)= -4 16
(8-8) = -0 0 (16- 16)= 0 0
(10-8) = +2 4 (20 - 16)= +4 16
(12-8)= +4 16 (24- 16)=+8 64
(SOMA) 40 160
_
Varincia:( X ) Sx2 = (Xi - X )2 /N = (40/ 5) = 8,0

Desvio padro ( X ) Sx = Sx2 = (8,0)1/2 = 2,828 = 2,83.

_
Varincia ( Y ) Sy2 = (Xi - Y )2 /N = (160/5) = 32,0.

Desvio padro ( Y ) Sy = Sy2 = 32,0 = 5,657 = 5,66.

Ento, Sy = 2.( Sx ) = 5,66 = 2(2,83).

63
Estatistica e Bioestatstica
2014

4.6 - Interpretao do Desvio Padro

O desvio padro no tem uma interpretao fsica como ocorre com a mdia aritmtica, contudo
possvel interpreta-lo de forma analtica pois indica o quanto, em mdia, os valores de uma srie esto
afastados da sua mdia aritmtica. O desvio padro, mede, portanto, o que se chama grau de homogeneidade
dos valores da srie.

Exemplo: Sejam dois alunos que tenham obtido as seguintes notas, em cinco avaliaes:
_
Aluno ( A ): X = { 4 5 6 7 8 } onde: X = 6.
_
Aluno ( B ): Y = { 2 4 6 8 10 } onde: Y = 6.
Portanto, os dois tem a mesma mdia. Entretanto, qual o mais regular?
Determinar qual srie de notas de cada aluno mais regular, (homognea), por meio do desvio
padro.
_
Tabela de clculo do desvio padro: S = S2 sendo: S2 = (Xi - X )2 /N

Aluno ( A ) Aluno ( B )

_ _ _ _
(X - X ) X - X )2 (Y - Y ) (Y - Y )2
(4-6) = -2 4 (2- 6)= -4 16
(5-6) = -1 1 (4- 6)= -2 4
(6-6) = 0 0 ( 6- 6)= 0 0
(7-6) = +1 1 (8- 6)= +2 4
(8-6)= +2 4 (10- 6)=+4 16
(SOMA) 10 40

_
Aluno ( A ): SA2 = (Xi - X )2 /N = 10/ 5 = 2 e SA = (SA2)1/2 =(2)1/2 = 1,4142.
_
Aluno ( B ): SB2 = (Yi - Y )2 / N = 40/ 5 = 8 e SB = ( SB2)1/2= 8 = 2,8284.
Sendo: SB = 2,8284 e SA = 1,4142 .. Como 2. 1,4142 = 2,8284.
Ou ainda, (SB = 2.SA) o desvio padro das notas do aluno ( B ) duas vezes maior que das notas do
aluno ( A ).

Portanto, verifica-se que o aluno ( B ) apresentou uma variao mdia de suas notas, duas vezes maior
que o aluno ( A ).Isso indica que o aluno ( A ) foi bem mais regular que o aluno (B ).

64
Estatistica e Bioestatstica
2014

Exemplo: Problema das filas dos hospitais - Consideremos dois hospitais. Hospital Providence onde
os pacientes formam filas separadas em trs guichet e o Hospital Assistence onde os pacientes formam fila
nica, tambm para trs guichet. Para cada um deles foi selecionada uma amostra aleatria de 10 pacientes,
onde foram anotados os seguintes tempos de espera em minutos na fila, at serem atendidos:

H. .P: ( X ) = { 4,2 5,4 5,8 6,2 6,7 7,7 7,7 8,5 9,3 10,0 }

H. A ( Y ) = { 6,5 6,6 6,7 6,8 7,1 7,3 7,4 7,7 7,7 7,7 }

Pede-se calcular para as duas amostras:

a) A amplitude total; mdia; a mediana; a moda.

b) O desvio padro e o coeficiente de variao.

c) Comparar os resultados obtidos e analisar os desvios padro.

Soluo: Tabela de clculo:

Hospital Providence Hospital Assitance

Tempo (Xi) Freq.( fi ) _ Tempo (Yi) Freq.( fi ) _


(Xi - X )2 fi (Yi - Y )2 .fi...
4,2 1 8,7025 6,5 1 0,4225
5,4 1 3,0625 6,6 1 0,3025
5,8 1 1,8225 6,7 1 0,2025
6,2 1 0,9025 6,8 1 0,1225
6,7 1 0,2025 7,1 1 0,0025
7,7 2 0,6025 7,3 1 0,0225
8,5 1 1,8225 7,4 1 0,0625
9,3 1 4,6225 7,7 3 0,9075
10,0 1 8,1225
TOTAL 10 29,8650 TOTAL 10 2,1450

a) Amplitude total: A = (10,0 - 4,2) = 5,8 A = (7,7 - 6,5) = 1,2


_ _
Mdias: X = 71,5 10 = 7,15 Y = 71,5 10 = 7,15
Modas: Mox = 7,7 Moy = 7,7
Medianas: Mex = 7,2 Mey = 7,2

b) Desvio Padro e Coeficiente de Variao do Hospital Providence.:


_
Sx = Fi (Xi - X )2 = 29,865 (10 - 1) = 3,3183 = 1,82
_
CVx% = (S X ).100 = (1,82 7,15).100 = 25,45%

Desvio padro e coeficiente de variao do Hospital Assistance:


_
Sy = Fi (Yi - Y )2 = 2,0450 (10 - 1) = 0,2272 = 0,48
_
CVy% = (S Y ).100 = (0,48 7,15).100 = 0,067%

65
Estatistica e Bioestatstica
2014
c) Ao realizar a Anlise das estatsticas obtidas: para as duas amostras, verificamos que so iguais: a
mdia, a moda e a mediana. As amplitudes totais; os desvios padro e o coeficiente de variao so muito
diferentes. O desvio padro do tempo de espera para o Hospital Assistance com fila nica cerca de 26%
menor do tempo do Hospital Providence, com fila por guichet. Portanto, a mdia do tempo, observado para a
fila nica, muito mais confivel ou certa de ocorrer na populao, que considerando a fila por guichet.

Exerccio: Um administrador deve comprar lmpadas para o hospital que trabalha. So apresentadas
duas marcas novas, com as respectivas duraes segundo os fabricantes: marca Ultralight, com vida til
_ _
mdia: X = 3 000 horas e desvio padro Sx = 200 horas ou a Eletrolyte, com vida til mdia: Y = 3 000 e
desvio padro Sy = 250 horas? Justifique.

4.7 - Desvio Quartil (Dq) (Amplitude Semi-Interquartlica)

Corresponde a mdia entre os quartis ( Q3 e Q1 ) com a seguinte frmula:

Dq = ( Q3 - Q1 ) 2 ou Dq = ( D 2) .

Cabe lembrar que o intervalo interquartil D = (Q3 - Q1 ) abrange 50% dos valores centrais da srie.

Esta medida de disperso tambm usada na Anlise Exploratria de Dados ( EDA), bastando usar o (
Dq ) no lugar do ( D ).

4.8 - Medidas de Disperso Relativa

As medidas de disperso relativas mais usadas so o coeficiente de variao e desvio quartil reduzido.

4.8.1 - Coeficiente de Variao ( cv )

O coeficiente de variao a mais importante medida de disperso relativa e definida como a razo
entre o desvio padro e a mdia aritmtica dos valores da srie. Este coeficiente, geralmente, expresso em
percentagem e tem a seguinte frmula: (Pearson )

_
CV% = (Sx X ).100.

O coeficiente de variao usado, principalmente, para medir e comparar a homogeneidade entre


sries de valores com diferentes unidades de medida ou com mdias muito discrepantes. Serve ainda para
comparar uma mesma srie, com valores obtidos com grande diferena de tempo.

4.8.2 - Desvio Quartil Reduzido ( Dqr )

O desvio quartil reduzido corresponde a razo entre o desvio quartil (Dq) e a mediana (Me), com a
seguinte frmula: Dqr = ( Dq / Me ) sendo:

Dq = ( Q3 - Q1) / 2.

E portanto: Dqr = ( Q3 - Q1) / (2.Me).

66
Estatistica e Bioestatstica
2014
Esta medida de disperso relativa usada na crtica e anlise dos dados para a homogeneidade dos
valores da srie, com a mesma aplicao do coeficiente de variao, quando no lugar da mdia se est
utilizando a mediana.

4.8.3 - Aplicao do Coeficiente de Variao

Na prtica, quando tem-se que comparar duas ou mais sries de valores podem ocorrer trs casos, em
que pode-se usar diretamente o desvio ou se faz necessrio o coeficiente de variao.

Caso 1 - As sries tem a mesma unidade de medida e suas mdias no so muito discrepantes. Neste
caso, vlida a comparao por meio da disperso absoluta ou seja, pelo desvio padro. O uso do coeficiente
de variao no acrescentar informao adicional significativa.

Exemplo: Sejam duas sries de alturas de pessoas com as seguintes mdias e desvios padro.
Determinar qual das duas mais homognea.

_
Srie ( A ): X = 172 Cm Sx = 5,6 Cm.

_
Srie ( B ): Y = 168 Cm Sy = 4,9 Cm.

As duas sries tem a mesma unidade de medida ( Cm ) e as suas mdias so prximas. A srie mais
homognea ser aquela que apresentar o menor desvio padro. Neste exemplo, a mais homognea a srie ( B
).

Caso 2 - As sries tem a mesma unidade de medida, mas as suas mdias so muito discrepantes. Neste
caso, em geral, deve-se usar o coeficiente de variao para se obter um resultado mais eficiente e confiveis,
pois a adoo do desvio padro pode acarretar erro.

Exemplo: Sejam duas sries com a mesma unidade de medida e com as seguintes mdias e desvios
padro. Determinar qual a mais homognea.

_
Srie ( C ): X = R$ 35,00 Sx = R$ 2,00.

_
Srie ( D ): Y = R$ 186,00 Sy = R$ 6,00.

As sries tem a mesma unidade de medida ( R$ ) mas as mdias so muito discrepantes. Neste caso,
deve-se calcular o coeficiente de variao e por meio deste, proceder a determinao.

_
Clculo do coeficiente de variao: CV% = (Sx / X ).100:
Srie ( C ): Cv% = ( 2 /35 ).100 = 5,71%.
Srie ( D ): Cv% = ( 6 /186 ).100 = 3,23%.
Verifica-se que a srie ( D ) mais homognea pois tem menor coeficiente de variao.

67
Estatistica e Bioestatstica
2014
Caso 3 - As sries tem diferentes unidades de medidas e, portanto, a comparao da disperso dos seus
valores feita necessariamente pelo coeficiente de variao. Neste caso, o coeficiente de variao, pela sua
definio, procede a eliminao da unidade de medida do desvio padro, para uma medida admensional, no
caso a porcentagem, Com isso, possvel comparar a homogeneidade das sries, uma vez que todas estaro em
porcentagem.

Exemplo: Sejam duas srie, uma de pesos ( Kg ) e outra de alturas ( Cm ), com as seguintes mdias e
desvios padro. Determinar a mais homognea.

_
Srie ( E ) - Pesos: X = 57,7 Kg Sx = 7,5 Kg.

_
Srie ( F ) - Alturas: Y = 170 Cm Sy = 8,9 Cm.

Neste exemplo, no se pode decidir a homogeneidade pelo desvio padro pois as sries tem unidades
de medidas. Perguntar, qual valor menor 7,5 Kg ou 8,9 Cm no tem sentido. Por isso necessrio
transformar esses valores para uma mesma forma, no caso admensional, como a porcentagem, por meio de uma
medida relativa. Portanto, para isso, usado o coeficiente de variao.

_
Clculo do coeficiente de variao: CV% = (Sx / X ).100:

Srie ( E ): Cv% = (7,5 / 57,7).100 = 12,99%.

Srie ( F ): Cv% = (8,9 / 170).100 = 5,23%.

Portanto, verifica-se que a srie ( E ) mais homognea pois tem menor coeficiente de variao
(apesar de ter maior desvio padro).

O coeficiente da variao ainda uma medida mais resistente que o desvio padro, pois pela sua
prpria definio, uma razo do desvio padro em relao a sua prpria mdia. Portanto, quando se deseja
aproveitar uma informao sobre a variabilidade de uma varivel, por meio de uma pesquisa h muito tempo
feita, o mais indicado, por ser menos influenciado pelo tempo, o coeficiente de variao. Neste caso, as
frmulas a serem utilizadas em que dependam do desvio padro, so modificadas para o uso do coeficiente de
variao.

Exemplo:numapesquisa por amostragem anteriormente realizada foram encontradas as seguintes


_
estatsticas: mdia de idade X = 25,6 anos e desvio padro S = 6,2 anos. Caso necessitemos desses dados
para uma nova pesquisa, principalmente para calcular o novo tamanho da amostra, como mais confivel,
_
podemos utilizar o coeficiente de variao: CV% = (S / X ).100 pois tanto a mdia quanto o desvio padro so
mais sujeitos a modificaes ao longo do tempo. Como exemplo, de aplicao semelhante, na prtica,
quando utilizamos sries de valores monetrios adotamos o valor do salrio mnimo como unidade de
referncia, de modo que com qualquer poca que se deseje comparar, no haver necessidade de usar correo
monetria, principalmente com diferentes moedas, tal como: Classes de sal. Mn. de 1 a 4; 5 a 8; 9 a 12; etc.

68
Estatistica e Bioestatstica
2014

4.9 - EXERCCIOS:

4.9.1) Os dados abaixo referem-se ao peso em gramas, de ratos machos da raa Wister com 30 dias de idade.

50 86 66 55 62 60 77
82 70 64 58 74 64 53
Pede-se:

a) O peso mdio b) O peso mediano c) O peso modal

d) A amplitude Total e) A varincia f)A disperso relativa

4.92) A tabela abaixo apresenta os pesos em gramas de 10 ratos selecionados com 30,35,40 e 45 semanas
respectivamente:

Com 30 semanas Com 35 semanas Com 40 semanas Com 45 semanas


76,2 95,5 99,2 134,6
81,5 90,0 101,2 136,2
50,0 60,0 63,2 85,3
47,5 50,0 57,5 84,0
63,5 79,2 82,1 110,0
65,1 75,7 79,3 98,7
63,2 74,8 79,0 98,3
65,1 74,1 96,0 122,7
64,5 85,2 95,4 131,1
66,4 79,5 86,6 111,1

Pede-se:

a) O peso mdio para 30, 35,40 e 45 semanas ;

b) O peso mediano para cada um dos tempos informados;

c) A varincia para os ratos com 30 semanas

d) Para os ratos com 45 semanas

e) O peso mediano para cada um dos tempos informados

f) O peso mdio e o peso mediano para as 40 observaes.

4.9.3) Os dados abaixo referem-se ao comprimento em centmetros de cobaias de 90 dias, segundo o sexo:

Masculino 25,5 26,0 26,5 25,0 26,0 25,0 24,0 25,0 25,5 26,0
Feminino 27,0 27,0 27,0 27,0 26,0 27,0 27,5 27,0 28,0 26,0
Para cada um dos sexos calcular:

a) A mediana b) O comprimento mdio c) A varincia d) O desvio Padro

Comparar os resultados.

69
Estatistica e Bioestatstica
2014

5 MEDIDAS DE ASSIMETRIA E CURTOSE

5.1 Coeficientes de Assimetria

5.1.1 - Clculo dos ndices de Assimetria

Uma distribuio de frequncias dita normal ou aproximadamente normal, quando o seu aspecto no
grfico diagrama de disperso se assemelha a uma forma de sino. No caso da normal, esta forma de sino bem
definida e simtrica em relao ao eixo vertical das frequncias e mais ainda, ocorre a igualdade entre a mdia,
a moda e a mediana.

Este formato da normal observado em muitas distribuies de frequncias de fenmenos sociais,


fsicos, biolgicos, etc. Como por exemplo, a distribuio dos pesos e das alturas das pessoas, o tempo de vida
til de muitos equipamentos, etc.

Considerando as distribuies normais ou aproximadamente normais, pode-se medir a sua assimetria


por meio de coeficientes apropriados, entre esses, o primeiro de Pearson, um dos mais usados.

5.1.1.2 - Primeiro Coeficiente (ou ndice) de Assimetria ( ca1 )

A assimetria de uma distribuio pode ser medida numericamente por meio dos coeficientes de
assimetria, entre os quais, o mais usado o Primeiro Coeficiente de Assimetria, proposto por Pearson., obtido
pela razo da diferena entre a mdia aritmtica e a moda, em relao ao desvio padro, formando a seguinte
frmula de clculo:

_
CA1 = ( X - Mo ) /. Sendo ( ) o desvio padro.
Por meio desta frmula verifica-se que esse coeficiente pode ser menor, igual ou maior que zero.
Portanto, quanto maior o valor deste coeficiente mais assimtrica ser a distribuio.
De acordo com o grau obtido, tem-se os seguintes casos:
_ _
a) CA1 = 0. Ento ocorre: X = Mo e ( X - Mo ) = 0.
_
Logo: CA1 = ( X - Mo )/ = 0 e a srie simtrica.
_
Neste caso tambm ocorrer: X = Md = Mo.
_
Na prtica pode-se encontrar X Mo e aceitar a simetria.
Exemplo 1: Sejam os dados de distribuio de renda de uma amostra de 54 trabalhadores de uma
empresa. Calcular o primeiro coeficiente de assimetria de Pearson e construir um histograma.

Distribuio da renda em salrios mnimos ( s.m. ) dos funcionrios do hospital M

Renda (s.m.) fi Pmi Pmi . fi


2 5 5 3,5 17,5
5 8 12 6,5 78,0
8 11 20 9,5 190,0
11 14 11 12,5 137,5
14 17 6 15,5 93
............... 54 - 516
_
X = (fi.Pmi) / fi = 516 / 54 = 9,5 9,5 ( SM ).

70
Estatistica e Bioestatstica
2014
Mo = li + { [ h.( fmax - fant ] /[ 2 fmax - (fpost+ fant ) ] }

Mo = 8 + { [ 3.( 20 - 12 ) ] / [ 2.20 - (11 + 12) ] }

Mo = 8 + { {24 ] / [ 40 - 23 ] } = 8 + { 24 / 17 } = 8 + 1,4 = 9,4 9,4 ( SM ).

_ _
Neste caso, X Mo ( 9,5 9,4 ) e ocorrer: CA1 = ( X - Mo ) / 0.

A distribuio simtrica.

Sugerimos traar o Histograma

_
b) CA1 > 0. Ento ocorre: Mo < X . Logo a srie assimtrica positiva (ou tem assimetria
direita).

_
Neste caso tambm ocorrer: Mo < Md < X

Exemplo 2: Sejam os dados de distribuio de renda de uma amostra de 64 alunos do primeiro


semestre de uma faculdade. Calcular o primeiro coeficiente de assimetria de Pearson e construir um
histograma.

Distribuio das idades dos alunos do primeiro semestre.

idades fi Pmi fi.Pmi


16 20 25 18 450,0
20 24 18 22 396,0
24 28 12 26 315,0
28 32 6 30 180,0
32 36 3 34 102,0
............... 64 - 1443,0

_
X = (fi.Pmi) / fi = 1 443 / 64 = 22,5 22,5 anos.

Mo = li + { [ h.( fmax - fant ] / [ 2 fmax - (fpost+ fant ) ] }

Mo = 16 + { [ 2.( 25 - 0 ) ] / [ 2 x.25 - (18 + 0) ] }

Mo = 16 + { [ 50 ] / [ 50 - 18 ] } = 16 + { 50 32 }

Mo = 16 + 1,56 = 17,56 18 anos.

_ _ _
Neste caso, Mo < X e ocorrer: ( X - Mo ) > 0 e portanto. CA1 = ( X - Mo ) / > 0.

A distribuio assimtrica positiva ou tem assimetria direita.

Sugerimos traar o Histograma

_
c) CA1 < 0. Ento ocorre: Mo > X . Logo a srie assimtrica negativa (ou tem assimetria
esquerda).

Neste caso tambm ocorrer: Mo > Md > Ma.

71
Estatistica e Bioestatstica
2014
Exemplo 3: Seja a distribuio das alturas de uma amostra de 64 alunos de uma escola de basquete de
uma universidade. Calcular o primeiro coeficiente de assimetria de Pearson e construir um histograma.

Distribuio das alturas ( em Cm ) dos alunos de uma universidade.

alturas ( X ) ( Fi.) ( Pmi ) (Fi .Pmi )

` 160 I---- 170 2 165 330,0

170 I---- 180 8 175 1 400,0

180 I---- 190 20 185 3 700,0

190 I---- 200 25 195 4 875,0

75 -- 10 305,0

Ma = (fi.Pmi) / fi = 10 305,0/ 75 = 137,2 Cm.

Mo = li + { [ h.( fmax - fant ] / [ 2 fmax - (fpost+ fant ) ] }

Mo = 190 + { [ 10.( 25 - 20 ) ] / [ 2 x.25 - (0 + 20) ] }

Mo = 190 + { [ 50 ] / [ 50 - 20 ] } = 190 + { 50 30 }.

Mo = 190 + 1,67 = 191,67 192 Cm.

Neste caso, Mo > Ma e ocorrer: ( Ma - Mo ) < 0 e portanto.

CA1 = ( Ma - Mo ) S < 0. A distribuio assimtrica negativa ou tem assimetria esquerda.


Sugerimos traar Histograma.

Comente cada uma das afirmativas abaixo: ( Livro Mrio Triola pg.6,7 e 8)

1) A American Association of Retired People- AARP(Associao Americana de Aposentados) alega que os


motoristas mais idosos se envolvem em menor nmero de acidentes do que os motoristas mais jovens,
fundamentado nofactode que nos ltimos anos, os motoristas de 16 a 19 anos de idade causaram cerca de 1,5
milho de acidentes, em comparao com apenas 540.000 causados por motoristas com 70 anos ou mais, de
forma. A alegao da AARP parece vlida?

2)numapgina inteira a Continental Airlines anuncia melhores servios. No tocante ao caso de bagagens
extraviadas, o anncio afirma tratar-se de uma rea em que j melhoramos 100% nos ltimos seis meses. Em
um editorial criticando essa estatstica, O New YORK Times interpretou corretamente a melhora de 100% como
significando no haver mais extravio de bagagens. O jornal estaria correto em seu comentrio?

3) Noventa por cento dos carros mais vendidos nos ltimos 10 anos ainda esto rodando. Milhes de
consumidores ouviram esta mensagem e ficaram com a impresso de que esses carros devem ter sido bem
construdos para durarem tanto. A alegao, embora correta, era enganosa Comente.

4) Uma pessoa foi encarregada de pesquisar o reconhecimento da marca Nike, devendo contactar 1500
consumidores nos EUA. Por que razo incorreta a utilizao de listas telefnicas como populao para
fornecer a amostra?

5)Setenta e sete por cento dos americanos espremem o tubo de dentifrcio a partir da parte superior. Essa
observao, assim como outras tambm no muito srias so apresentadas em The First Really Important

72
Estatistica e Bioestatstica
2014
Survey of American Habits (a primeira pesquisa realmente importante dos hbitos dos Americanos). Esses
resultados se baseiam em 7000 respostas a 25000 questionrios enviados pelo Correio. Qual o lado errado da
pesquisa?

6)Um relatrio da Flrida Citrus Commission concluiu que os nveis de colesterol podem ser reduzidos
mediante ingesto de produtos ctricos. A concluso poderia ser suspeita?

7)Uma funcionria tem um salrio anual de $40000, mas informada de que ter uma reduo de 10% no
pagamento em virtude do declnio dos lucros da Companhia. informada tambm de que no prximo ano ter
um aumento de 10%. A situao no se afigura to m, porque a reduo de 10% parece ser compensada com o
aumento de 10%. Procede a observao?

8) A revista Glamour publicou o resultado de uma pesquisa Setenta e nove por cento dos que responderam a
nossa pesquisa de Agosto afirmaram crer que os Americanos se tornaram demasiadamente propensos a apelar
para a justia em casos corriqueiros

A questo foi publicada na revista e os leitores podiam responder pelo fax e pelo e-mail da empresa . At que
ponto vlido o percentual de 79%?

9) Uma pesquisa inclui o seguinte item Registre a sua altura em Polegadas. Com isso pretende-se obter e
analisar as alturas dos que respondem. Identifique os dois problemas neste item?

10)Procure identificar quatro falhas na afirmativa Um jornal realizou uma pesquisa solicitando a resposta dos
leitores a esta pergunta: Voc apoia o desenvolvimento de armas atmicas que podem matar milhes de
pessoas inocentes. Relata-se que de 20 leitores que responderam 87% com no e 13% com Sim?

11)O jornal Newport Chronicle afirma que as mes grvidas podem aumentar suas chances de ter um beb
sadio comendo lagostas. A alegao se baseia em um estudo mostrando que as crianas nascidas de mes que
comem lagostas tm menos problemas de sade do que as nascidas de mes que no comem lagostas. Qual o
erro na alegao?

12)Um artigo do New York Times afirmou que a durao mdia da vida de 35 regentes de orquestra do sexo
masculino era de 73,4 anos, em contraste com a mdia de 69,5 anos para a populao masculina em geral. A
vida mais longa foi atribuda a fatores como satisfao pessoal e motivao. H uma falha fundamental na
concluso de que os regentes de orquestra do sexo masculino vivem mais. Qual ?

13) Um pesquisador do Sloan-Kettering Cancer Research Center foi criticado certa vez por adulterar dados.
Entre seus dados estavam cifras obtidas de seis grupos de ratos, com 20 ratos em cada grupo. Foram dados os
seguintes valores como porcentagens de sucesso: 53%; 58%, 63%, 46%, 48% e 67%. O que est errado?

14)Um editorial do New York Times criticou um anncio que alegava que determinado anti-sptico bucal
reduzia em mais de 300% as placas nos dentes.

a)Removendo-se 100% de uma quantidade quanto resta?

b)Que significa reduzir as placas em mais de 300%?

15)A revista Business Week faz uma pesquisa, enviando pelo Correio um questionrio a 5000 pessoas que
investem em ttulos.Com base nos resultados, os editores das revistas concluem que a maioria dos investidores
nos EUA esto pessimistas quanto economia. Qual o erro desta deciso?

16)Pesquisadores do Censo constataram que ao perguntarem as idades dos entrevistados encontram mais
pessoas com 50anos do que com 49 ou com 51 anos. Explique porque isso ocorre?

17)O pesquisador pretende fazer uma pesquisa com os alunos de sua Universidade. Onde est o erro ao
selecionar sempre o 50 estudante que sai da lanchonete.

73
Estatistica e Bioestatstica
2014
18)Quando o General Pinochet ficou em priso domiciliar na Inglaterra um jornal publicou a seguinte
notcia:.... Segundo a pesquisa, realizada em Santiago do Chile por telefone, no final da semana passada, com
uma amostra de 961 pessoas, 32%dos entrevistados disseram que ele deveria voltar para o Chile .Outros 17%,
afirmaram no saber a resposta.. Comente a notcia?

19)..E mais : os leitores pediram e ns atendemos. Esta frase do publisher da revista Internet World, de
Dezembro de 1998, exprime uma deciso tomada com base em sugestes recebidas. Discuta como poderiam Ter
sido coletadas as opinies dos leitores, indicando pontos de possveis falhas na amostragem.

20)Aps uma pesquisa, h uma crtica inicial das observaes para verificar a exatido de cada resposta. O
objetivo , se necessrio, repetir alguma entrevista, retificar os valores duvidosos e preparar o material para
ser colocadonumaescala numrica.

a)Justifique a necessidade dessa crtica

b)Discuta a necessidade de se investir no treinamento dos entrevistadores para evitar esse trabalho de
depurao.

21)Qual a vantagem de ao realizarmos uma pesquisa de opinio identificarmos os entrevistados? E a


desvantagem?

74
Estatistica e Bioestatstica
2014

RESPOSTAS:

1)Ofactodos adolescentes de 16 a 19 anos causarem maior nmero de acidentes no significa obrigatoriamente


que os jovens sejam mais imprudentes ao volante do que os idosos. A comparao descrita seria aceita se fosse
informado o nmero de motoristas em cada uma das faixas etrias comparadas. Provavelmente o nmero de
idosos acima de 70 anos que ainda dirigem bem menor do que o nmero de motoristas jovens de 16 a 19 anos.

Alm do mais a Associao Nacional de Aposentados na verdade uma parte interessada no resultados do
levantamento da a suspeio sobre a notcia veiculada.

2) Da forma como foi veiculada a matria, o leitor induzido a concluir de que o extravio de bagagens deixou
de existir. Porm tal situao nunca ocorreu e o ndice informado, na verdade tenta informar que o nmero de
extravios foram reduzidos a metade.

3) A propaganda enganosa, pois no informada a produo a produo anual. Da a falta de consistncia


pois a produo pode ter sido acelerada por exemplo somente nos ltimos anos, dando a impresso de que os
veculos de uma forma geral, durem bastante.

4) As listas telefnicas no podem e nem devem ser utilizadas como cadastro pois nem todos os domiclios
possuem telefones e outros possuem mais de um aparelho( uma linha). Assim sendo o procedimento no
correto pois os domiclios no possuiro a mesma chance de serem selecionados.

5) Dos 25000 formulrios enviados, somente 7000 retornaram. Constatamos que no poderemos inferir sobre a
populao, em funo de que os 7000 que responderam podem representar a populao em estudo ou apenas
um segmento da referida populao.

6) A concluso por demais suspeita em virtude do rgo que patrocinou a pesquisa parte interessada em seu
resultado.

7) Errado pois a reduo do salrio em um percentual, mesmo que seja concedido um aumento de igual
percentual o valor do salrio no retorna ao nvel anterior.

Exemplo: 40000 - 10% de 40000 = 36000

36000 + 10% de 36000 = 39600

8) temerrio concluir acerca de hbitos do povo Americano a partir de resultados de pesquisa junto a leitores
de uma revista lida somente por um segmento especfico da populao. Uma outra crtica que nem todos os
leitores da revista tiveram oportunidade de responder a pesquisa ou no possuam fax e nem possuam
computadores.

9) A medida utilizada inadequada pois ao levantarmos dados sobre altura o ideal que os dados sejam
coletados em metros ou centmetros. Por outro lado aconselhvel em pesquisas desse porte que as alturas
sejam tomadas entrevistadores.

10) A pergunta como foi formulada estimula ao entrevistado a condenar mais ainda a utilizao de armas. Uma
outra falha reside no reduzido nmero de entrevistados (20) . A outra irregularidade que com os percentuais
informados 87% e 13%, jamais seriam alcanados ao se entrevistarem 20 indivduos.

11) O erro que as mes tem chances de darem a luz a filhos saudveis em funo do alto poder aquisitivo e
no por comerem lagostas. Em funo da alta renda a me provavelmente fez um pr-natal alimenta-se a
contento.

75
Estatistica e Bioestatstica
2014
12) A comparao teria sentido se fossem comparadas os bitos da populao masculina a partir da idade em
que um indivduo inicia-se como regente, ou seja aps 30 anos por exemplo..

13) Os percentuais de cada grupo terminaria obrigatoriamente em 0 ( zero) ou 5 (cinco) da a inconsistncia


para 53%,58%,63%,46%48% e 67%.

14) A reduo no mximo seria 100%:

Pela lgica as placas seriam erradicadas;

Parece-nos que ele deseja dizer que a quantidade de placas reduziu a 1/3 da situao anterior.

15) A pesquisa deveria ser realizada em todos os segmentos de mercado de investimentos.

16) Existe uma forte tendncia das pessoas a serem entrevistadas a informarem suas idades em anos terminados
em zero ou 5.

17) A amostra ser composta por alunos que utilizam a lanchonete. Logo nem todos os alunos possuem a
mesma chance de serem selecionados. Da a inconsistncia.

18) A forma como foi divulgado o resultado da pesquisa de um certo modo mascara o resultado principal ou
seja 51% de que ele no deveria voltar para o Chile.

19) As modificaes na revista a partir de sugestes devem ser feitas em caso de realizao de uma pesquisa ou
seja so entrevistados leitores que concordam com alinha editorial , aqueles que discordam e os indiferentes.
No aconselhvel alteraes a partir de crticas recebidas pois a grande maioria no foi consultada

20- a) Antes da crtica mecnica aconselhvel a realizao de uma crtica visual de modo que erros
grosseiros sejam eliminados de forma a tornar mais rpida a crtica de consistncia.

b) de suma importncia a utilizao de recursos com vistas a treinamento de pessoal a fim de que sejam
minimizados os problemas inerentes a coleta de dados.

A principal vantagem e que o entrevistado pode ser consultado sobre qualquer uma de suas respostas.

A desvantagem que a identificao do entrevistado em determinadas situaes

76
Estatistica e Bioestatstica
2014

8. Estatstica Paramtrica e No Paramtrica

Os testes estatsticos podem ser divididos em dois grandes grupos, conforme fundamentem ou no os seus
clculos na premissa de que a distribuio de frequncias dos erros amostrais normal, as varincias so
homogneas, os efeitos dos fatores de variao so aditivos e os erros independentes. Se tudo isso ocorrer,
muito provvel que a amostra seja aceitavelmente simtrica, ter com certeza apenas um ponto mximo,
centrado no intervalo de classe onde est a mdia da distribuio, e o seu histograma de frequncias ter um
contorno que seguir aproximadamente o desenho em forma de sino da curva normal. O cumprimento desses
requisitos condiciona pois a primeira escolha do pesquisador, uma vez que, se forem preenchidos, ele poder
utilizar a estatstica paramtrica, cujos testes so em geral mais poderosos do que os da estatstica no-
paramtrica, e conseqentemente devem ter a preferncia do investigador, quando o seu emprego for permitido.

Paramtricos: calcula as diferenas numricas exactas entre os resultados.

No paramtricos: apenas consideram se certos resultados so superiores ou inferiores a outros resultados.

Requisitos para utilizao de testes paramtricos

Quando se pretende empregar um teste t de Student ou uma anlise da varincia para fazer comparaes entre
amostras (testes paramtricos), existe uma lista de requisitos que inclui, entre outros:

que a varivel tenha sido mensurada num nvel mnimo intervalar;

que a distribuio seja simtrica e mesocurtica;

que a caracterstica estudada (varivel) tenha distribuio normal numa dada populao.

Sempre que no se pode, honestamente, admitir a simetria e a normalidade de distribuio, ou os dados foram
recolhidos num nvel de mensurao inferior ao intervalar, devemos recorrer a testes que no incluem a
normalidade da distribuio ou nvel intervalar de mensurao. Esses testes chamam-se no paramtricos

Vantagens dos testes no-paramtricos

Podem ser utilizados, mesmo quando os seus dados s podem ser medidos num nvel ordinal, isto , quando for
apenas possvel orden-los por ordem de grandeza) podem ser utilizados mesmo quando os seus dados so
apenas nominais, i.e., quando os sujeitos podem apenas ser classificados em categorias.

77
Estatistica e Bioestatstica
2014
Poder de um teste

O poder de um teste a probabilidade de rejeitarmos a H0 quando ela realmente nula

Os testes mais poderosos (os que tm maior probabilidade) de rejeio de H0, so testes que possuem pr-
requisitos mais difceis de satisfazer (testes paramtricos como t e F).

As alternativas no paramtricas exigem muito menos pr-requisitos mas produzem testes de significncia com
menos poder que os correspondentes paramtricos.

Em consequncia

Ao rejeitar-se a H0 sem preencher as exigncias mnimas dos testes paramtricos, mais provvel que essa
rejeio seja falsa (se rejeitar a H0 quando ela verdadeira comete um erro de tipo I; se aceitar a H0 quando
ela falsa comete um erro de tipo II). Quando os requisitos de um teste paramtrico so violados, torna-se
impossvel conhecer o seu poder e a sua dimenso ()

obvio que os investigadores querem, a todo o custo, rejeitar a H0 quando ela mesmo falsa, evitando um erro
de tipo I.

O teste ideal seria aquele que =0 e =1, o que implicaria que o teste conduziria sempre deciso correcta,
contudo este teste ideal raramente existe.

A probabilidade do erro de 1 espcie deve ser reduzida, fixando terico em 0,1; 0,05 ou 0,01. o valor fixado
para depende da importncia que se d ao facto de rejeitar a H0 quando esta verdadeira.

Uma ilustrao deste ponto de vista pode ser feita com o seguinte exemplo:

Uma pessoa inocente at prova do contrrio

H0: A pessoa inocente

H1: A pessoa culpada

Erro I: A pessoa condenada mas est inocente

Erro II: A pessoa absolvida mas culpada

Naturalmente a justia procura reduzir a possibilidade de ocorrer o erro de 1 espcie, pois entende-se que
mais grave condenar inocentes que absolver criminosos.

Para certos sistemas judiciais um = 0,1 demasiado elevado, optando por =0,01; noutros sistemas judiciais
pode admitir que = 0,05 um valor razovel.

ASSIM

Fixada a probabilidade do erro de tipo I (dimenso do teste), o teste mais potente aquele em que a escolha da
regio critica minimiza a probabilidade do erro de 2 espcie. Diz-se tambm que esta regio critica a mais
potente.

78
Estatistica e Bioestatstica
2014
Facilmente se conclui que o teste mais potente aquele que, uma vez fixada a probabilidade de rejeitar a H0,
quando ela verdadeira, maximiza a potncia ou a capacidade para rejeitar a mesma hiptese quando esta
falsa.

Pressupostos

Para saber se uma varivel simtrica dividimos o coeficiente assimetria (Skewness) pelo erro padro e se o
resultado estiver entre 2 e -2 a distribuio simtrica.

Para saber se uma varivel mesocurtica dividimos o coeficiente de achatamento (Kurtosis) pelo erro padro e
se o resultado estiver entre 2 e -2 a distribuio mesocurtica.

Mas se os resultados de um teste paramtrico, no cumpriram com os requisitos (no mnimo dados intervalares;
distribuio simtrica, mesocurtica e normal), ento no tm interpretao significativa.

Quando acontecem estes factos, a maioria dos investigadores opta por testes de significncia no-paramtricos.

Para escolher qualquer tipo de teste estatstico

Distinguir se a nossa amostra constituda pelos mesmos sujeitos em todas as situaes ou se formada por
diferentes sujeitos para cada situao

Inter-sujeitos ou design no-relacionado

este tipo de design utilizado quando um indivduo ou objecto avaliado apenas uma vez. A comparao
efectuado entre os grupos de sujeitos/ objectos cujos resultados so no-relacionados.

Desvantagem: conjunto das diferenas individuais na forma como os sujeitos reagem ou respondem tarefa.

Intra-sujeitos ou design relacionado

A comparao feita entre os mesmos sujeitos (sujeitos do mesmo grupo).

A importncia destes designs a eliminao de quaisquer particularidades individuais, uma vez que ficam
igualizadas em todas as situaes.

Desvantagem: Efeito de memria e aprendizagem.

Amostras emparelhadas

Igualizam-se sujeitos diferentes mas emparelhados, em termos de idade, sexo, profisso e outras caractersticas
gerais que parecem importantes para cada pesquisa em particular.

estes tipos de designs podem ser considerados de designs relacionados, uma vez que controlado nas suas
caractersticas relevantes.

79
Estatistica e Bioestatstica
2014
Desvantagem: Dificuldade em encontrar sujeitos que permitam o emparelhamento de todas as caractersticas
relevantes.

Dificuldades arranjar grandes amostras.

Desvio-padro e testes no-paramtricos.

Quando um pesquisador utiliza testes no-paramtricos, supe-se que a distribuio de seus dados
experimentais no seja normal, ou que ele no tenha elementos suficientes para poder afirmar que seja. Na
dvida quanto a essa informao, nada impede que ele opte pelo uso da estatstica no-paramtrica. O que ele
no pode fazer, de modo algum, argumentar em termos de desvios ou erros padres, embora possa
perfeitamente faz-lo pura e simplesmente em termos de mdias.

Qual teste usar, sejam paramtricos ou no-paramtricos?

Qualquer que seja pois a opo do pesquisador, a essa altura de sua investigao cientfica ele se acha diante
de mais um dilema: qual, dentre os muitos testes estatsticos existentes em ambas as categorias acima citadas,
seria o mais apropriado, no caso especfico de seu trabalho, ou do modelo matemtico de seus ensaios? Que
elementos desse modelo matemtico condicionariam a opo por um ou outro desses testes? Em geral a
resposta est contida no prprio modelo experimental de cada pesquisa. Os detalhes adicionais que devem
orientar a escolha do teste so:

a) a existncia ou no de vinculao entre dois ou mais fatores de variao;

b) o nmero de componentes da amostra, que vo ser comparados.

De facto, seja qual for o tipo de estatstica escolhida, paramtrica ou no-paramtrica, h testes
especificamente destinados a amostras em que h independncia entre os factores de variao, e outros para
amostras em que existe vinculao ou dependncia entre eles.

Da mesma forma, o nmero de comparaes a serem realizadas pelo teste tambm importante, porque h
testes elaborados para comparar apenas duas amostras, e h outros destinados a comparaes mltiplas,
entendendo-se como mltiplas um nmero de comparaes superior a dois.

Num experimento factorial, por exemplo, em que h factores colocados nas colunas, nas linhas e nos blocos, o
nmero de comparaes fornecido pela multiplicao do nmero de colunas, pelo nmero de linhas e pelo
nmero de blocos. Enfim, o produto factorial semelhante ao usado para calcular o nmero total de dados da
amostra, s no entrando no clculo o nmero de repeties.

Assim sendo, no caso do experimento factorial que, a partir de alguns captulos atrs, nos vem servindo de
exemplo com 4 colunas, 3 linhas e 2 blocos o nmero de comparaes possveis, incluindo-se nele no s
os fatores de variao principais mas tambm todas as interaes possveis entre eles, seria: 4 x 3 x 2 = 24
comparaes.

Classificao dos testes estatsticos (GMC verso 7.5): O diagrama abaixo esquematiza as subdivises dos
testes estatsticos, listando os mais comumente utilizados na prtica:

80
Estatistica e Bioestatstica
2014

Alguns desses testes usam nmeros como varivel, outros usam sinais + e , outros usam valores fixos, como
1 e 0, e outros ainda utilizam frequncias. Esses testes evidentemente esto todos includos no grupo dos testes
no-paramtricos, simplesmente porque no usam os parmetros mdia e desvio-padro em seus clculos.

A filosofia de cada teste estatstico.

Aps a concluso destes conceitos iniciais e dos conhecimentos bsicos que se deve ter sobre os mtodos
estatsticos, sero includos neste texto alguns breves comentrios sobre cada um dos testes listados acima. So
resumos sobre o que chamei de Filosofia do Teste, e neles procurei dar uma idia geral sobre o que tinha em
mente o criador de cada um deles, e a quais modelos matemticos eles se adaptam, bem como em quais
circunstncias cada qual poderia ser utilizado.
Mas so apenas observaes condensadas, que evidentemente os interessados podero ampliar, pela leitura e
pelo estudo mais aprofundado em compndios mais elaborados do que este, sobre a Cincia Estatstica, que os
h em grande quantidade.

Apresentao dos resultados dos testes.

Uma vez realizados os testes adequados, estes do o seu parecer, sob a forma de um valor numrico,
apresentado (conforme o teste) como valor de F (anlise de varincia), de t (teste t, de Student), U (Mann-
Whitney), Q (teste de Cochran), (letra grega qui, testes diversos, que usam o chamado qui-quadrado), z
(McNemar e Wilcoxon), H (Kruskal-Wallis), ou (letra grega rho, utilizada nos testes de correlao, que sero
focalizados mais adiante, neste texto).

No-significncia estatstica (H0).

Seja como for, o valor numrico calculado pelo teste deve ser confrontado com valores crticos, que constam
em tabelas apropriadas a cada teste. Essas tabelas geralmente associam dois parmetros, que permitem
localizar o valor crtico tabelado: nvel de probabilidades (usualmente 5 % [ = 0,05], ou 1 % [ = 0,01]), e o
nmero de graus de liberdade das amostras comparadas.

81
Estatistica e Bioestatstica
2014
Valores menores que o tabelado indicam que ele no pode ser considerado diferente do que se obteria se as
amostras comparadas fossem iguais. Enfim, estaria configurado o que se chama de no-significncia
estatstica, ou de aceitao da hiptese zero, ou de nulidade (H0).

Significncia estatstica (H1).

Porm, se o valor calculado for igual ou maior que o tabelado, aceita-se a chamada hiptese alternativa
(H1), ou seja, a hiptese de que as amostras comparadas no podem ser consideradas iguais, pois o valor
calculado supera aquele que se deveria esperar, caso fossem iguais, lembrando sempre que a igualdade, em
Estatstica, no indica uma identidade. Isso quer dizer que pode eventualmente haver alguma diferena, mas
esta no deve ultrapassar determinados limites, dentro dos quais essa diferena decorre apenas da variao
natural do acaso, tpica da variao entre as repeties do ensaio.

No caso de o valor calculado ser maior do que o valor tabelado, diz-se que h significncia estatstica, que
pode ser ao nvel de 5 %, se o valor calculado for maior que o valor tabelado para 5 %, porm menor que o
tabelado para 1 %. Ou ao nvel de 1 %, caso o valor calculado seja igual ou maior que o valor tabelado para
1%.

82
Estatistica e Bioestatstica
2014
8.1. Testes paramtricos passo-a-passo

8.1.1 O que so testes paramtricos?


Os termos paramtrico e no-paramtrico referem-se mdia e ao desvio-padro, que so os parmetros que
definem as populaes que apresentam distribuio normal. Essa observao j foi feita e repetida muitas vezes
neste texto. Volto a reafirm-la, todavia, porque tenho visto muitas vezes artigos cientficos, alm de trabalhos e
teses acadmicas, em que se usaram testes no-paramtricos, mas os resultados eram apresentados em termos
de mdia desvio-padro da distribuio, ou ento em termos de mdia erro-padro da mdia, erro este que
tambm um valor calculado em funo do desvio-padro da amostra.

8.1.2 Os parmetros da curva normal.


Ora, de qualquer conjunto de valores numricos pode-se calcular a mdia, porm, desvio-padro, somente as
curvas normais o possuem, uma vez que, por definio, "desvio-padro o ponto de inflexo da curva normal"
e de mais nenhuma outra. So eles em nmero de dois e simtricos em relao mdia da distribuio.
Portanto, curvas assimtricas jamais podem ter desvio-padro porque, mesmo que tenham pontos de inflexo,
como os possuem muitas outras curvas matemticas, eles dificilmente seriam simtricos em relao mdia.
Enfim, mesmo que distribuies experimentais possam apresentar alguma assimetria, esta deve manter-se
dentro de certos limites, aceitveis em termos estatsticos e aceitveis porque atribudos variao casual
determinada pelos erros no-controlados de amostragem, ou seja, variao do acaso, tpica das variveis e
amostras chamadas aleatrias.

8.1.3 Correlao

Correlao - a relao ou dependncia entre as duas variveis de uma distribuio bidimensional.

Quando estudamos um grupo relativamente a dois caracteres vemos, como j dissemos, que pode existir uma
relao entre eles.

Se medirmos os raios de vrias circunferncias e tambm os seus permetros verificamos que existe uma relao
entre eles que constante; neste caso temos "dependncia funcional". Isto quer dizer que existe uma frmula
exprimindo a medida do segundo em funo da do primeiro: P=2 r.

Suponhamos agora que registamos, durante todos os dias de um certo perodo de tempo, a altura mxima da
mar no porto da Figueira da Foz e o nmero de passageiros da linha Porto-Lisboa. V-se bem que entre as
duas estatsticas assim obtidas no se encontra nenhuma relao. Diremos que os dois caracteres so
"independentes".

Mas entre estes dois casos extremos, a dependncia funcional e a independncia, a vida corrente oferece um
grande nmero de exemplos onde existe uma relao entre os caracteres, mas em que existe uma
impossibilidade de a formular por uma lei: o caso da "dependncia estatstica". Existe uma dependncia
estatstica entre as pessoas que morrem com febre tifide e as pessoas vacinadas contra esta doena.

Desde que os dois caracteres sejam tais que as suas variaes sejam sempre no mesmo sentido, ou em sentidos
contrrios, pressentimos que os caracteres estejam ligados entre si: dizemos, ento, que eles esto
correlacionados ou que existe uma correlao entre eles.

83
Estatistica e Bioestatstica
2014
Estes mtodos de correlao foram criados por Sir Francis Galton, que trabalhou juntamente com Pearson, nos
fins do sculo XIX.

A correlao e a regresso so dois aspectos que andam sempre muito ligados, pertencendo Estatstica
Descritiva. Assim, importa fazermos a distino entre eles:

A correlao pode ser definida como o grau de semelhana no sentido das variaes entre os valores
correspondentes dos dois caracteres, isto , a correlao preocupa-se com a descrio da relao entre
variveis.

A regresso usada quando tentamos predizer uma varivel quando conhecemos a outra.

8.1.3.1 Tipos de coeficiente de correlao


Basicamente, podemos considerar dois tipos de coeficientes de correlao:

- Coeficiente de correlao momento-produto de Brawais-Pearson, cujo smbolo "r", e que uma tcnica de
estatstica paramtrica;

- Coeficiente de correlao Rho de Spearman-Rank, cujo smbolo "", e que uma tcnica de estatstica no
paramtrica.

Devemos salientar que, para o clculo das correlaes, necessrio termos sempre duas medidas para cada
sujeito.

8.1.3.2 Representao grfica


representao grfica da correlao chamamos diagrama de disperso de pontos ou scatterplot ou
scattergram e, genericamente, toma a seguinte forma:

80

70

60

50

40
Z

40 50 60 70 80

FIGURA 20: DIAGRAMA DE DISPERSO DE PONTOS OU SCATTERPLOT OU SCATTERGRAM

84
Estatistica e Bioestatstica
2014

Correlao Fraca ou Nula -quando o Diagrama de Disperso no permite o ajustamento de nenhuma recta, o
que significa que r ou prximo deste, diz-se, ento, que no existe nenhuma relao entre as variveis da
Distribuio Bidimensional.

Correlao Negativa Forte - quando a recta de regresso, obtida a partir do Diagrama de Disperso, tem
declive negativo. A correlao negativa quando r varia entre -1 e 0 e ser tanto mais forte quanto r se
aproxima de -1.

Correlao Negativa Perfeita ou Linear - quando a recta de regresso, obtida a partir do Diagrama de
Disperso, tem declive negativo com r

Correlao Positiva Forte - quando a recta de regresso, obtida a partir do Diagrama de Disperso, tem
declive positivo. A correlao positiva quando r varia entre 0 e 1 e ser tanto mais forte quanto r se aproxima
de 1.

Correlao Positiva Perfeita ou Linear - quando a recta de regresso, obtida a partir do Diagrama de
Disperso, tem declive positivo com r .

Suponhamos que temos duas sries estatsticas formadas pelos valores xi e yi de dois caracteres. Podemos fazer
uma representao grfica dos dados representando todos os pontos (xi, yi) e obtendo a nuvem de pontos.

Segundo os dados, a nuvem de pontos pode apresentar diversos aspectos.

Por exemplo os pontos podem distribuir-se na semelhana de uma linha recta ou de uma curva: isto sugere a
existncia de uma relao funcional entre X e Y.

Os pontos podem ser dispersos e colocados ao acaso no plano: caso das mars no porto da Figueira da Foz e o
nmero de passageiros na linha Porto-Lisboa (independncia). Tambm pode acontecer que os pontos cubram
uma poro do plano da qual se pode definir o contorno; esta forma sugere que as duas variveis esto ligadas.
Limitemo-nos ao caso mais simples em que a nuvem tem uma forma alongada lembrando uma elipse e
suponhamos que a sua orientao tal que desde que X cresa, a varivel Y tambm cresce. A forma desta
nuvem sugere a possibilidade da existncia de uma recta tal que os valores estimados por esta recta, a partir
dos valores de xi, sejam boas aproximaes dos valores de yi. Ns podemos determinar pelo mtodo dos
mnimos quadrados uma recta tal que a soma dos quadrados dos desvios seja mnima. Esta recta chamada
recta de regresso de Y em X ou recta de estimao de Y em X.

Mas, poderamos, de um modo semelhante, procurar uma recta tal que os valores de x estimados ao longo desta
recta, a partir de yi, constituam igualmente boas aproximaes de xi. Esta recta chamada recta de regresso
de X em Y ou recta de estimao de X em Y.

Normalmente, estas rectas so distintas uma da outra. Elas sero confundidas quando existe ligao funcional
linear e so perpendiculares quando h independncia. Compreendemos, assim, que a correlao entre os
caracteres tanto maior quanto maior as rectas de regresso estejam mais prximas uma da outra.

8.1.3.3 Coeficiente de correlao momento-produto de brawais-pearson

Coeficiente de Correlao Linear de Pearson ( r )-medida estatstica que permite calcular o valor numrico
correspondente ao grau de dependncia entre duas variveis quantitativas, o qual varia entre -1 e 1.

85
Estatistica e Bioestatstica
2014
Correlao Fraca ou Nula -quando o Diagrama de Disperso no permite o ajustamento de nenhuma recta, o
que significa que r Diz-se, ento, que no existe nenhuma relao entre as variveis da Distribuio
Bidimensional.

Correlao Negativa Forte - quando a recta de regresso, obtida a partir do Diagrama de Disperso, tem
declive negativo. A correlao negativa quando r varia entre -1 e 0 e ser tanto mais forte quanto r se
aproxima de -1.

Correlao Negativa Perfeita ou Linear - quando a recta de regresso, obtida a partir do Diagrama de
Disperso, tem declive negativo com r

Correlao Positiva Forte - quando a recta de regresso, obtida a partir do Diagrama de Disperso, tem
declive positivo. A correlao positiva quando r varia entre 0 e 1 e ser tanto mais forte quanto r se aproxima
de 1.

Correlao Positiva Perfeita ou Linear - quando a recta de regresso, obtida a partir do Diagrama de
Disperso, tem declive positivo com r

Condies de utilizao

Este tipo de coeficiente de correlao utiliza-se quando:

As duas variveis so contnuas;

A distribuio se aproxima da distribuio normal;

prefervel para distribuies unimodais;

Escala intervalar de medida.

Frmula de r de Pearson

86
Estatistica e Bioestatstica
2014
8.1.3.3.1 Interpretao
O coeficiente de correlao obtido pode se interpretado com base em:

Para Cardoso:

r 0,2 Correlao muito baixa (valores desprezveis)

0,2 < r 0,5 Correlao baixa

0,5 < r 0,7 Valores significativos

0,7 < r 0,9 Alta correlao

0,9 < r 1 Muito alta correlao

Para Borg:

0,20 < r 0,35 Ligeira relao entre as variveis, embora j possam ser estatisticamente significativas

0,35 < r 0,65 Correlao estatisticamente significativa para alm do nvel de 1%

0,65 < r 0,85 Correlaes que tornam possveis predies do grupo de que so dignas

r > 0,85 ntima relao entre as variveis correlacionadas

87
Estatistica e Bioestatstica
2014
Para Byrman e Cramer,

se Eta, r, Rho, phi:

0,2 Correlao muito fraca e sem significncia

0,2 < r 0,39 Correlao fraca

0,4 < r 0,69 Correlao moderada

0,7 < r 0,89 Correlao forte

0,9 < r 1 Correlao muito elevada

Coeficiente de correlao d-nos:

A direco que indicada pelo sinal + ou -

A intensidade ou fora que dada pelo valor que varia entre -1 e 1. Se a correlao for zero no existe
correlao entre as variveis (exemplo: cor dos olhos e inteligncia).

Exemplo: Considere as classificaes obtidas por 10 alunos nas disciplinas X, Y, Z e W:

Quadro 25:
Estudante X Y Z W XY XZ XW YZ YW ZW

1 75 75 45 45 5625 3375 3375 3375 3375 2025


2 70 70 50 50 4900 3500 3500 3500 3500 2500
3 70 70 50 50 4900 3500 3500 3500 3500 2500
4 65 65 55 55 4225 3575 3575 3575 3575 3025
5 60 60 60 60 3600 3600 3600 3600 3600 3600
6 60 60 60 60 3600 3600 3600 3600 3600 3600
7 55 55 65 65 3025 3575 3575 3575 3575 4225
8 50 50 70 70 2500 3500 3500 3500 3500 4900
9 50 50 70 70 2500 3500 3500 3500 3500 4900
10 45 45 75 75 2025 3375 3375 3375 3375 5625
600 600 600 600 36900 35100 35100 35100 35100 36900

Sabe-se que: X=60 Y=60 Z=60 W=60

XY=36900 XZ=35100

s2x= 90 s2y= 90 s2z= 90 s2 w= 90

88
Estatistica e Bioestatstica
2014

a) Calcule o coeficiente de correlao entre X e Y e represente graficamente.

b) Calcule o coeficiente de correlao entre X e Z e represente graficamente.

Resoluo 47:

a)

(XY) - X Y
r= N ..
sx sy
Ento,

36900 _ 60x60

10
_________________________________________
r=
90 x 90
r= = 1

Existe uma relao positiva muito forte entre X e Y

b)

(XZ) - X Z
r= N ..
sx sZ
Ento,

35100 _ 60x60

10
________________________________________
r=
90 x 90
r= = -1

Existe uma relao negativa muito forte entre X e W, isto , quanto maior X menor Y e vice versa.

8.1.4 Teste t de Student para amostras independentes (no relacionado)


Caractersticas para utilizao do TESTE T:

Teste para a comparao de mdias;

Distribuio com forma leptocrtica, isto , as caudas da distribuio so mais grossas do que na distribuio
normal;
Contnua;
Simtrica;
De forma campanular;

89
Estatistica e Bioestatstica
2014
Varia de mais infinito a menos infinito;
Mdia = 0 e desvio padro da varivel de acordo com n.
O uso de T pressupe que a varivel observacional tenha na populao (de onde foi colhida a amostra)
distribuio normal;

No existe uma distribuio t, mas sim uma famlia. Para cada n - tamanho da amostra - existe uma
distribuio (uma curva) especfica;

medida que n cresce, t tende a z (a aproximao entre t e z comea a ficar "boa" a partir de n >=30).

Requisitos para utilizar o teste t:

1. Quando as duas amostras tm a mesma homogeneidade de varincia;

2. Os dois grupos tenham a mesma distribuio aproximada normal - leptocrtica;

3. Escala de medida intervalar.

Quando utilizar

Utiliza-se para designs experimentais com duas situaes testando uma varivel independente, quando nessas
situaes se encontram sujeitos diferentes - designs no relacionados.

O teste t no relacionado equivalente ao teste no paramtrico U de Mann-Whitney; ambos comparam


diferenas entre dois grupos.

Objectivo

O objectivo comparar a quantidade da variabilidade devida s diferenas previstas nos resultados entre dois
grupos com a variabilidade total nos resultados dos sujeitos. As diferenas previstas so calculadas como uma
diferena entre os resultados mdios entre os dois grupos.

A estatstica t representa o tamanho da diferena entre as mdias para os dois grupos, tomando em
considerao a varincia total. Para que o valor observado de t seja significativo ter de ser igual ou superior
aos valores crticos de t apresentados na tabela.

Instrues passo-a-passo

Elevar ao quadrado cada resultado individual para ambos os grupos em separado

Adicionar os totais dos resultados ao quadrado para cada grupo

Elevar ao quadrado todos os resultados individuais para cada grupo

Calcular a mdia para cada grupo

Calcular t:

90
Estatistica e Bioestatstica
2014
1 - 2
t= _________________________________________________________________
x12 - ( x1)2 + x22 - ( x2)2
______ ______
n1 n2 1 1
___________________________________ __ + __
(n1 - 1) + (n2 - 1) n1 n2
em que

1 = mdia do grupo 1

2 = mdia do grupo 2

x12 = soma dos quadrados para o grupo 1

x22 = soma dos quadrados para o grupo 2

( x1)2 = resultados totais do grupo 1 ao quadrado

( x2)2 = resultados totais do grupo 2 ao quadrado

n1 = nmero de sujeitos do grupo 1

n2 = nmero de sujeitos do grupo 2

Calcular g.l.:

g.l. = (n1 - 1) + (n2 - 1)

Se t observado > t crtico rejeita-se Ho

Se t observado < t crtico no se rejeita Ho

91
Estatistica e Bioestatstica
2014
Exemplo: para verificar se duas dietes para emagrecer so igualmente ificazes, um mdico separou ao acaso um conjunto de pacientes em
dois grupos. Cada paciente seguiu a dieta designada para o seu grupo durante 4 meses. O mdico registou a perda de peso em kg de cada
paciente por grupo. Os dados esto apresentados no quadro que se segue:

Quadro 26:
Grupo 1 (dieta 1) Grupo 2 (dieta 2)

Resultados Resultados ao quadrado Resultados Resultados ao quadrado

10 100 2 4
5 25 1 1

6 36 7 49

3 9 4 16
9 81 4 16
8 64 5 25
7 49 2 4
5 25 5 25
6 36 3 9
5 25 4 16
Total x1 = 64 x12 = 450 x2 = 37 x22 = 165
Mdia 1 = 6,4 2 = 3,7

Instrues Passo-a-Passo:
1. construir a tabela

2. x1 = 64
x2 = 37
x12 = 450
x22 = 165
3. (x1)2 = 64 X 64 = 4096
(x2)2 = 37 X 37 = 1369
4. 1 = 6,4
2 = 3,7

6,4 - 3,7
t =_________________________________________________________ =
450 - 4096 + 165 - 1369
______ ______
10 10 1 1
_______________________________ __ + __
9+9 10 10

2,7
= ______________ = 3,095

3,806.0,2

6. g.l. = (n1 - 1) + (n2 - 1) = (10 - 1) + (10 - 1) = 18

92
Estatistica e Bioestatstica
2014

O valor de t observado (3,095) superior ao valor crtico de 2,878 (Anexo VII), indicando um nvel de
significncia de p < 0,005 para uma hiptese unicaudal ou p < 0,01 para uma hiptese bicaudal.

10.3 Teste t de Student (relacionado)

Quando utilizar

Utiliza-se para designs experimentais com duas situaes testando uma varivel independente, quando os
mesmos sujeitos (ou emparelhados) se encontram em ambas as situaes - design relacionado. O teste t
relacionado equivalente ao teste no paramtrico de Wilcoxon.

Objectivo

O objectivo comparar as diferenas entre as duas situaes experimentais com a variabilidade total nos
resultados. Quando os mesmos sujeitos so usados em ambas as situaes podem comparar-se pares de
resultados obtidos por cada indivduo quando sujeito a ambas as situaes.

A estatstica t apresenta o tamanho das diferenas entre os resultados dos sujeitos para as duas situaes. Para
que seja significativo o valor de t ter de ser igual ou superior aos valores crticos da tabela (Anexo VII).

Instrues passo-a-passo

1. Calcular as diferenas entre os resultados dos sujeitos subtraindo os resultados da situao B para a
situao A

2. Elevar essas diferenas ao quadrado

3. Calcular o somatrio das diferenas obtidas (d)

4. Calcular o somatrio do quadrado das diferenas (d2)

5. Elevar ao quadrado as diferenas totais (d)2

6. Calcular t:
d
t = ___________________________________
N d2 ( d)2
N-1

em que
d = soma das diferenas dos resultados A e B
d2 = soma dos quadrados das diferenas
( d)2 = soma das diferenas elevadas ao quadrado
N = nmero de sujeitos
Calcular g.l.:
g.l. = N - 1 Se t observado > t crtico rejeita-se H0 Se t observado < t crtico no se rejeita H0

93
Estatistica e Bioestatstica
2014

Exemplo: Para verificar se a eficcia de uma dieta era influenciada pelo ministrar de um frmaco,
um mdico decidiu administrar, a um grupo de individuos que o tinham procurado para perder peso,
um placebo em conjunto com uma dieta que j havia administrado um ms antes aos mesmos sujeitos.
Referiu aos seus casos que aquele medicamento servia para perder apetite e ajudava a queimar
gorduras.

Registou a perda de peso que tinha ocorrido nos 30 dias antecedentes tomada de placebo e trinta
dias aps o placebo. Os resultados esto no quadro que se segue

Sujeito Situao A Situao B d d2


(com placebo) (s com dieta) (A-B)
____________________________________________________________________________
1 10 2 8 64
2 5 1 4 16
3 6 7 -1 1
4 3 4 -1 1
5 9 4 5 25
6 8 5 3 9
7 7 2 5 25
8 5 5 0 0
9 6 3 3 9
10 5 4 1 1
___________________________________________________________________________
Total 64 37 d = 27 d2 = 151
Mdia 6,4 3,7
Resoluo 50:

Instrues Passo-a-Passo:

1. construir tabela

2. calcular as mdias

3. d = 27

4 d2 = 151

5. ( d)2 = 27 x 27 = 729

6. proceder aos calculos

27 27
____________________________ _______________
t= - = = 27 / 9,316 = 2,90
10 x 151 (27) 2 86,78
10 - 1

7. g.l. = N - 1 = 10 - 1 = 9

94
Estatistica e Bioestatstica
2014

Como o valor observado de t de 2,90 superior ao valor crtico de 2,821 ao nvel de significncia de p < 0,01
(unicaudal) ou p < 0,02 (bicaudal), e a mdia de perda de peso superior com o placebo, o mdico concluiu
que o efeito de placebo positivo na perda de peso

O ponto 10.3 explica como comparar mdias de duas populaes, com base em amostras dessas populaes.
Mas s vezes preciso comparar mdias de mais de duas populaes. Por exemplo, para verificar se pessoas
com diferentes nveis socioeconmicos, isto , alto, mdio e baixo tm, em mdia, o mesmo peso corporal,
preciso comparar mdias de trs populaes.

Para comparar mdias de mais de duas populaes aplica-se o teste F, na forma que a seguir se descreve,
desde que a varivel em estudo tenha distribuio normal ou aproximadamente normal. Mas antes de mostrar
como se faz esse teste, convm apresentar um exemplo.

Imagine que quatro grupos, todas com cinco elementos, conduziram aos dados apresentados no quadro 28. As mdias dessas amostr as
esto na ltima linha desse quadro. Ser que as diferenas das mdias das amostras so suficientemente grandes para que se possa afirmar
que as mdias das populaes so diferentes? Para responder a esta pergunta, preciso um teste estatstico.

Quadro 28: Dados de 4 amostras e respectivas mdias


A B C D
11 8 5 4
8 5 7 4
5 2 3 2
8 5 3 0
8 5 7 0
40 25 25 10
8 5 5 2

95
Estatistica e Bioestatstica
2014

10.4 ANLISE DE VARINCIA

10.4.1 Anlise da Varincia com Igual Tamanho

Se a varivel em estudo tem distribuio normal ou aproximadamente normal, para comparar mais de duas
mdias aplica-se o teste F.

Primeiro, preciso estudar as causas de variao. Por que os dados variam? Uma explicao o facto de as
amostras provirem de populaes diferentes. Outra explicao o acaso, porque at mesmo os dados
provenientes de uma mesma populao variam.

O teste F feito atravs de uma anlise de varincia, que separa a variabilidade devido aos "tratamentos" (no
exemplo, devido s amostras terem provindo de populaes diferentes) da variabilidade residual, isto , devido
ao acaso. Para aplicar o teste F preciso fazer uma srie de clculos, que exigem conhecimento da notao.
.

O quadro 29 apresenta os dados de k tratamentos, cada um com r repeties (no exemplo, denominam-se
repeties os elementos da mesma amostra). A soma das repeties (r) de um mesmo tratamento constitui o
total desse tratamento (T). O total geral (T) dado pela soma dos k totais de tratamentos.

QUADRO 29: NOTAO PARA ANLISE DA VARINCIA


1 2 3 ... K Total

x11 X21 X31 xk1

x12 X22 X32 ... xk2

. . . . .

. . . . .

. . . . .

x1r X2r X3r Xkr

Total T1 T1 T1 T1 T=x

N. de repeties r r r r N=kr

Mdia 1 2 3 k

Para fazer a anlise de varincia preciso calcular as seguintes quantidades:

1. passo:

os graus de liberdade (gl)dos grupos: k 1

gl do total: n-1

gl dos residuos: (n-1)-(k-1) = n-k

96
Estatistica e Bioestatstica
2014

2. passo:

calcular o valor de Correco (C) que dado pelo total geral ao quadrado e dividido pelo nmero de dados.

C = (x)2
FORMULA C: n

calcular a Soma dos Quadrados Total (SQT)

SQT = x2-C
FORMULA SQT:

calcular a Soma do Quadrado do Total de cada repetio (SQTr)

FORMULA SQTr: SQTr = T2 - C


r

calcular a Soma dos Quadrados dos Resduos (SQR)

SQR = SQT-SQTr
FORMULA SQR:

calcular o Quadrado mdio do Total de cada repetio (QMTr)

QMTr = SQTr
FORMULA QMTr: k-1

calcular o Quadrado mdio do Total do Residuo (QMR)

QMR = SQR
FORMULA QMR: n-k

Calcular o valor de F

FORMULA QMTr:
F = QMTr
QMR

3. Passo: comparar o F calculado com o valor dado na tabela de F, ao nivel de significncia estabelecido,
observando os k-1 graus de liberdade no numerador e os n-k graus de liberdade no denominador (coluna da
esquerda).

97
Estatistica e Bioestatstica
2014
Exemplo: Um profissional de sade recm contratado para acompanhar um conjunto de atletas de alta
competio, verificou, pelos registos clnicos deixados pelo seu antecessor, que alguns atletas com o mesmo tipo
de leso (em grau e extenso) tinham mais recidivas que outros, apesar das condies de treino e o tempo de
recuperao ser o mesmo. Colocou a hiptese de que tal acontecimento se podia dever s diferentes
teraputicas que eram utilizadas para tratar as mesmas leses. Os resultados podem ser observados no quadro
que se segue:

Quadro 30: recidivas por tratamento


Tratamento Tratamento Tratamento Tratamento
A B C D
11 8 5 4
8 5 7 4
5 2 3 2
8 5 3 0
8 5 7 0
40 25 25 10
8 5 5 2

1. passo:

os graus de liberdade (gl)dos grupos: k 1 = 4-1=3

gl do total: n-1 = 20-1=19

gl dos residuos: n-k = 20-4=16

2. passo:

calcular o valor de Correco (C) que dado pelo total geral ao quadrado e dividido pelo nmero de dados.

C = (x)2 = (11+8+5+4+8+5+7+4+5+2+3+2+8+5+3+8+5+7)2 = 1002 = 500


N 20 20

calcular a Soma dos Quadrados Total (SQT)

SQT = x2-C = 112+82+52+42+82+52+72+42+52+22+32+22+82+52+32+82+52+72 - 500

= 658-500

=158

Calcular a Soma do Quadrado do Total de cada repetio (SQTr)

SQTr = T2 C = 402+252+252+102 - 500


R 5
= 590-500

= 90

98
Estatistica e Bioestatstica
2014

calcular a Soma dos Quadrados dos Resduos (SQR)

SQR = SQT-SQTr = 158-90

= 68
calcular o Quadrado mdio do Total de cada repetio (QMTr)

QMTr = SQTr = 90 = 30
k-1 3

calcular o Quadrado mdio do Resduo (QMR)

QMR = SQR = 68 = 4,25


n-k 16

calcular o valor de F

F = QMTr = 30 = 7,06
QMR 4,25

3. passo: ir tabela F para um nvel de significncia (p) de 5% (0,05) e observar qual o F terico para 3 e 16
graus de liberdade (anexo). Como o valor calculado (7,06) maior que o da tabela (3,24), conclumos que as
mdias das recidivas diferem em funo do tratamento, para um nvel de significncia de 0,05.

A acompanhar este comentrio, os valores calculados devem ser apresentados num quadro, da seguinte forma:

Quadro 31: ANOVA


Causas de variao gl SQ QM F p
Tratamentos 3 90 30 7,06 <0,05
Resduo 16 68 4,25
Total 19 158

Mas, como se pode observar, apesar da tabela mostrar que existem diferenas significativas, no nos informa,
que tratamentos que produzem diferenas e quais so semelhantes. Sempre que as diferenas so
significativas, e s nesse caso, temos que proceder s comparaes posteriori (Post-Hoc). Podemo-nos
socorrer de diversos testes (LSD; Bonferroni; Sidak; Scheffe; SNK; Tukey; etc.), a grande diferena entre eles
reside no tipo de distribuio em que assentam e no tipo de ajustamento). Apresentaremos de seguida apenas o
teste de Tukey, por ser dos mais utilizados e o mais simples de calcular, quando recorremos ao clculo manual.

99
Estatistica e Bioestatstica
2014
10.4.1.1 Teste de Tukey para comparao entre as mdias

O teste Tukey permite estabelecer a diferena mnima significante, ou seja, a menor diferena entre as mdias
que deve ser tomada como significativa em determinado nvel de significncia. Essa diferena (dms) dada
por:

dms =q QMR
r

Onde q um valor dado em tabela (Anexo____)

QMR o quadrado mdio do residuo da ANOVA

r o nmero de repeties

assim, se consultarmos a tabela verificamos que o q para comparar quatro tratamentos com 16 gl no residuo
de 4,05. como QMR=4,25 e r=5, temos:

dms =4,05 4,25 = 3,73


5

De acordo com o teste de Tukey, duas mdias so estatisticamente diferentes sempre que o valor absoluto da
diferena entre elas for igual ou superior ao valor da dms.

Passemos ento observao dos valores:

Quadro 32: post-hoc das recidivas


Pares de mdias Valor absoluto da diferena dms p

A-B (8-5) 3 3,73 ns


A-C (8-5) 3 ns
A-D (8-2) 6 <0,05
B-C (5-5) 0 ns
B-D (5-2) 3 ns
C-D (5-2) 3 ns

fcil de observar que s existem diferenas entre a mdia dos tratamentos A e a mdia dos tratamentos D, em
que o tratamento D aquele com que se obtm, significativamente, menos recidivas

100
Estatistica e Bioestatstica
2014

10.4.2 ANLISE DE VARINCIA COM DIFERENTES TAMANHOS

O pesquisador, nem sempre tem amostras do mesmo tamanho, mesmo assim possivel conduzir uma anlise da
varincia (ANOVA). Alis todos os clculos, com excepo SQTr, so feitos da mesma forma em ambas as
situaes.

Assim em vez de fazer a soma dos quadrados pela frmula

SQTr = T2 - C
r

Utiliza:

SQTr = T12 + T22 ++ Tk2 - C


FORMULA:
r1 r2 rk

Para mais fcil de entender observe o seguinte exemplo:

Quadro 33: mdias por tratamento


Tratamento A Tratamento B Tratamento C

15 23 19
10 16 15
13 19 21
18 18 14
15 16
13
84 76 85

1. passo:

os graus de liberdade (gl)dos grupos: k 1 = 3-1=2

gl do total: n-1 = 15-1=14

gl dos residuos: n-k = 14-2=12

101
Estatistica e Bioestatstica
2014

2. passo:

calcular o valor de Correco (C) que dado pelo total geral ao quadrado e dividido pelo nmero de dados.

C = (x)2 = 2452 = 4001,67

n 15

calcular a Soma dos Quadrados Total (SQT)

SQT = x2-C = 152+102+132++162 4001,67

=159,33

calcular a Soma do Quadrado do Total de cada repetio (SQTrat)

SQTrat = T12 + T22 ++ Tk2 - C

r1 r2 rk

SQTr = 842+762+852 4001,67


6 4 5
= 63,33

calcular a Soma dos Quadrados dos Resduos (SQR)

SQR = SQT-SQTr = 159,33-63,33 = 96

calcular o Quadrado mdio do Total de cada repetio (QMTr)

QMTr = SQTr = 63,33 = 31,67

k-1 2

102
Estatistica e Bioestatstica
2014
calcular o Quadrado mdio do Resduo (QMR)

QMR = SQR = 96 = 8

n-k 12

calcular o valor de F

F = QMTr = 31,67 = 3,96

QMR 8

3. passo: ir tabela F para um nvel de significncia (p) de 5% (0,05) e observar qual o F terico para 2 e 12
graus de liberdade (anexo). Como o valor calculado (3,96) maior que o da tabela (3,89), conclumos que as
mdias dos sujeitos diferem em funo do tratamento, para um nvel de significncia de 0,05.

Os valores calculados devem ser apresentados da seguinte forma:

Quadro 34: ANOVA


Causas de variao gl SQ QM F p
Tratamentos 2 63,33 31,67 3,96 <0,05
Resduo 12 96 8
Total 14 159,33

Como as diferenas so significativas, temos que proceder s comparaes posteriori (Post-Hoc). O resultado
do teste de Tukey o seguinte:

10.4.2.1 Teste de Tukey para comparao entre as mdias

O teste Tukey para amostras com tamanhos diferentes dada pela seguinte frmula:

dms =q 1 + 1 QMR
ri rj 2

No caso do exemplo, para comparar a mdia de A com a mdia de B tem-se:

dms (A;B) =3,77 1 + 1 8,00


6 4 2
dms (A;B) =4,87

103
Estatistica e Bioestatstica
2014

No caso do exemplo, para comparar a mdia de A com a mdia de C tem-se:

dms (A;C) =3,77 1 + 1 8,00


6 5 2
dms (A;C) =4,57

No caso do exemplo, para comparar a mdia de B com a mdia de C tem-se:

dms (B;C) =3,77 1 + 1 8,00


4 5 2
dms (B;C) =5,06

De acordo com o teste de Tukey, duas mdias so estatisticamente diferentes sempre que o valor absoluto da
diferena entre elas for igual ou superior ao valor da dms.

Passemos ento observao dos valores:

Quadro 35: post-hoc


Pares de mdias Valor absoluto da diferena dms p
A-B |14-19| = 5 4,87 <0,05
A-C |14-17| = 3 4,57 ns
B-C |19-17| = 2 5,06 ns

Conclui-se que em mdia A significativamente diferente de B, ao nvel de significncia de 0,05.

8.1. Testes no paramtricos (NP) passo-a-passo

8.1.1 Teste do qui-quadrado

O Qui-Quadrado (X2) de aderncia consiste em comparar os dados obtidos experimentalmente com os dados
esperados de acordo com a lei. Das comparaes surgem diferenas que podem ser grandes ou pequenas: se
forem grandes, a hiptese nula (H0) que pressupe um bom ajustamento dever ser rejeitada em favor da
hiptese alternativa (H1); se forem pequenas, a hiptese nula no ser rejeitada e as diferenas so atribuveis
ao acaso.

O X2 de independncia serve para ajudar a decidir se as duas variveis esto ou no "amarradas" uma outra
por uma relao de dependncia.

104
Estatistica e Bioestatstica
2014
QUANDO UTILIZAR

Utiliza-se quando os dados so nominais, pelo que em vez de se medirem resultados dos sujeitos apenas se
podem distribuir os sujeitos por uma ou mais categorias.
O Qui-Quadrado (X2) testa a hiptese experimental que prev quantos sujeitos de cada grupo so distribudos
por uma determinada categoria.
O X2 um teste estatstico no paramtrico, sendo um dos mais utilizados e bastante aplicado em diferentes
planeamentos experimentais. O X2 muito usado mesmo ao nvel da estatstica multivariada (no sentido de
obter o grau de aderncia entre o modelo obtido e o terico).

OBJECTIVO

O objectivo comparar frequncias observadas com frequncias tericas ou esperadas, ou seja, verificar o seu
grau de aproximao, que pode ser grande (=0) ou pequeno (>0).
Assim, o objectivo comparar as frequncias observadas em cada uma das clulas de uma tabela de
contingncia com as diferenas esperadas. O teste compara o nmero de sujeitos que se distribuem por uma
determinada categoria com o nmero de sujeitos que se esperaria se distribussem por essa mesma categoria,
caso no existissem diferenas.
O teste do X2 reflecte o tamanho das diferenas entre as frequncias observadas e esperadas. Para ser
significativo, o valor de X2 dever ser igual ou superior aos valores crticos da tabela (Anexo I).

INSTRUES PASSO-A-PASSO
1. Calcular as frequncias esperadas (E) para cada clula, multiplicando os dois totais parciais relevantes para
cada uma e dividindo pelo nmero total de sujeitos.
2. Calcular X2:
(O-E)2
______________
X2 =
E
em que
O = frequncias observadas para cada clula
E = frequncias esperadas para cada clula

3. Calcular os graus de liberdade:


g.l. = (r-1) (c-1)
em que
r = nmero de linhas da tabela de contingncia
c = nmero de colunas da tabela de contingncia

Se X2 observado > X2 crtico rejeita-se H0


Se X2 observado < X2 crtico no se rejeita H0
Especificando para uma tabela de dupla entrada 2X2:
g.l. = (nmero de colunas - 1) (nmero de linhas - 1) = 1X1 = 1

Quando uma tabela tem mais de duas entradas:


g.l. = (nmero de colunas - 1) (nmero de linhas - 1)

X2 = (total de linha) (total de coluna)


(total geral)

105
Estatistica e Bioestatstica
2014
Exemplo: Suponha que quer estudar se os estudantes de cincias sociais utilizam um mtodo de estudo
significativamente diferente daquele que utilizado pelos estudantes de tecnologia. Escolheram-se dois grupos,
um composto por 50 estudantes de cincias sociais e o outro por 50 estudantes de tecnologia. Enviou-se um
questionrio aos 100 estudantes pedindo-lhes que indicassem em qual das seguintes categorias melhor se
enquadra o seu mtodo de estudo: estudo dirio regular, estudo irregular em perodos concentrados de
trabalho intensivo ou uma mistura dos dois. Foram recebidas 44 respostas dos estudantes de cincias sociais e
42 dos estudantes de tecnologia. Colocou-se a hipotese experimental (H1) de que o tipo de estudo dependia do
curso frequentado

Os resultados so apresentados na forma de uma tabela 2X3, designada por tabela de contingncia (crosstab).
As "clulas" que representam cada uma das categorias so numeradas de 1 a 6.

Quadro 12: Tabela de Contingncia (Crosstab)

Tipo de estudo
Regular Irregular Misto Total parcial do
nmero de
estudantes
Grupo 1 1 2 3
Estudantes de 6 15 23 44
Cincias Sociais E=8,19 E=11,77 E=24,05
Grupo 2 4 5 6
Estudantes de 10 8 24 42
Tecnologia E=7,81 E=11,23 E=22,95
Totais dos padres
de estudo 16 23 47 N=86

Resoluo 49:

Instrues Passo-a-Passo:

1. calcular as frequencia esperadas (E)

Clula 1: E = 16X44 / 86 = 8,19

Clula 2: E = 23X44 / 86 = 11,77

Clula 3: E = 47X44 / 86 = 24,05

Clula 4: E = 16X42 / 86 = 7,81

Clula 5: E = 23X42 / 86 = 11,23

Clula 6: E = 47X42 / 86 = 22,95

2. Aplicar a frmula
(O-E)2
2 ________________
X =
E

X2 = (6-8,19)2 + (15-11,77)2 + (23-24,05)2 + (10-7,81)2 + (8-11,23)2 + (24-22,95)2


8,19 11,77 24,05 7,81 11,23 22,95

X2 = 0,59 + 0,89 + 0,05 + 0,61 + 0,93 + 0,05 = 3,12

106
Estatistica e Bioestatstica
2014

3. Calcular os graus de liberdade (gl)

g.l. = (r - 1) (c - 1) = (2 -1) (3 - 1) = 2

4. Consultar a tabela (Anexo I)

Para

p=0,05 e gl=2

x2 critico=5,99

Concluses: Dado que o valor observado de X2 apenas de 3,12, ou seja, inferior ao valor crtico de 5,99 para
p < 0,05, o resultado da experincia no significativo. Aceita-se hiptese nula de que os padres de estudo
dos estudantes de cincias sociais e de tecnologia no diferem, rejeitando-se desta forma a nossa hipotese
experimental (H1).

8.1.1 Testes NP para duas amostras independentes

Ao estudarmos as diferenas entre dois grupos podemos utilizar grupos relacionados/emparelhados ou grupos
independentes. No caso de duas amostras independentes determinamos se as diferenas nas amostras
constituem uma evidncia convincente de uma diferena nos processos de tratamento a elas aplicados.

Conquanto o uso de duas amostras relacionadas em projectos de pesquisa tenha mritos indiscutveis, a sua
aplicao, em geral, no prtica. Frequentemente, a natureza da varivel dependente impede a utilizao dos
indivduos como seus prprios controlos, tal como ocorre quando a varivel dependente o suicidio tentado;
um problema que pode acontecer uma nica vez. Pode ser tambm impossvel delinear um projecto que utilize
pares de dados, talvez por desconhecimento, por parte do investigador, de variveis teis que possam formar
pares, ou pela impossibilidade de obter mensuraes adequadas de alguma varivel de reconhecida
importncia ou, enfim, porque simplesmente no se dispe de pares adequados.

Quando a utilizao de duas amostras relacionadas no prtica ou adequada, podemos utilizar duas amostras
independentes. Em tais projectos, as duas amostras podem ser obtidas por um de dois mtodos:

Podem ser extradas aleatoriamente de duas populaes;

Podem decorrer da atribuio aleatria de dois tratamentos aos membros de uma amostra de origem
arbitrria.

Nota: Em nenhum destes casos se exige que as amostras tenham o mesmo tamanho.

107
Estatistica e Bioestatstica
2014

5.4 Teste U de Mann-Whitney

8.1.2 Procedimentos para ordenao de resultados

Os testes U de Mann-Whitney; Wilcoxon; H de Kruskal-Wallis; rho de Spearman; tau de Kendall e Friedman,


exigem o recurso a ordenaes de resultados para efectuar os seus clculos. Neste sentido comearemos por
explicar os procedimentos de ordenao de resultados

Ordenamento global de resultados (designs no-relacionados para sujeitos diferentes):

Atribua a ordem mais baixa 1 ao resultado mais baixo, a ordem seguinte 2 ao resultado seguinte mais baixo, e
por a fora.

Os resultados nulos de 0 so contados como o resultado mais baixo possvel, sendo-lhe atribuda a ordem mais
baixa.

Quando existem resultados idnticos so-lhe atribudas ordens mdias, calculadas com base na globalidade das
ordens que deviam ter sido atribudas a estes resultados.

Exemplo: ordenar um grupo em funo do n. de factores de risco

Tabela 13: Ordenao de um grupo em funo do n. de factores de Risco


N. de Factores Ordem
de risco
6 4
3 1
12 7
Se existir um
4 2 zero este deve
7 5 ser considerado
5 3 o valor mais
8 6 baixo.

Nos casos em que existem resultados iguais utiliza-se a dos lugares que devia ocupar

108
Estatistica e Bioestatstica
2014
Exemplo:

N. de FR. Ordem

1 2
2 4
1 2
4 6,5
1 2
3 5
4 6,5
6 9
5 8

Assim os sujeitos com um Factor de risco so 3 (1+1+1) que ocupariam o 1. - 2. - 3. lugar

ento 3+2+1=6:(1+1+1)=2

com 4 factores de risco temos 2 sujeitos que ocupariam o 6. e 7. lugar

ento 6+7=13:(1+1)=6,5

Ordenamento de diferenas entre resultados (designs relacionados para os mesmos sujeitos ou emparelhados):

Em geral, a atribuio de ordens s diferenas entre resultados efectua-se tal como fizemos para os resultados,
sendo atribuda a ordem mais baixa menor diferena e por a adiante;

Diferenas idnticas entre resultados so ordenadas da mesma forma que resultados idnticos, atribuindo-se
uma ordem mdia resultante da globalidade de ordens que essas diferenas deveriam ocupar;

Resultados nulos de 0 so contados como o resultado mais baixo possvel quando se calculam diferenas entre
resultados;

Contudo, quando existe igualdade entre resultados que originem uma diferena nula entre as situaes
experimentais, estes no so ordenados, sendo retirados da anlise;

Diferenas positivas e negativas so ordenadas em conjunto como se se tratasse de um ordenamento simples de


resultados, ignorando os sinais positivos e negativos.

109
Estatistica e Bioestatstica
2014
Exemplo: Suponha que quer ordenar as diferenas entre o nmero de frases correctas que um grupo de
crianas com suspeita de perda auditiva produziu antes da colocao de um aparelho auditivo e aps a
colocao daquele.

Quadro 14: Ordenao para Amostras Relacionadas ou Emparelhadas


N de frases correctas N de frases correctas
Sujeitos antes do aparelho depois do aparelho diferenas ordem
auditivo auditivo
1 5 6 1 2

2 5 7 2 4

3 2 3 1 2

4 1 5 4 6,5

5 4 5 1 2

6 2 5 3 5

7 1 5 4 6,5

8 4 4 0 -

9 1 7 6 9

10 1 6 5 8

Ao contrrio do que acontece nos casos das amostras relacionadas quando a diferena entre 2 situaes nula
nas amostras relacionas a este tipo de resultado no atribuda nenhuma ordem, sendo que o resultado nem
sequer considerado na anlise. No ordenamento de resultados negativos em amostras relacionadas ignoram-
se os sinais quando se ordenam os resultados.

Quando Utilizar

Dadas duas amostras, de tamanhos n1 e n2, possvel, mediante a prova U de Mann-Whitney, saber se ambas
as amostras podem ser consideradas provenientes da mesma populao.

Como j se sabe, a estatstica paramtrica s pode ser usada desde que os dados tenham sido mensurados, no
mnimo, no nvel intervalar. Alm disso, as amostras devem ser aleatrias, independentes e a varivel
observacional precisa de ter distribuio normal na populao.

O teste U de Mann-Whitney deve ser utilizado em designs com duas situaes, no-relacionados, quando so
utilizados sujeitos diferentes em cada uma das situaes experimentais.

110
Estatistica e Bioestatstica
2014
Exemplo: Suponha que quer investigar o n. de queixas dolorosas durante um tratamento a um mesmo problema
teraputico (controlada a gravidade e a extenso da leso) em que se utilizaram duas tcnicas diferentes. A
hipotese experimental supe que durante a utilizao da tcnica B que o doente se apresenta mais queixoso.

Quadro 15: Resultados do registo das queixas


Paciente A Ordem (1) B Ordem (2)
1 3 3 9 11
2 4 4 7 9
3 2 1,5 5 5,5
4 6 7,5 10 12
5 2 1,5 6 7,5
6 5 5,5 8 10
TOTAL 22 T1=23 45 T2=55
MDIA 3,67 7,5

Racional

O racional que est por trs do teste U de Mann-Whitney bastante semelhante ao do teste de Wilcoxon. A
diferena fundamental entre as duas reside no facto do segundo se aplicar a designs relacionados e o U se
aplicar a designs no-relacionados, utilizando, portanto, sujeitos diferentes. O teste de Wilcoxon analisa as
diferenas entre a performance dos mesmos sujeitos (ou pares de sujeitos emparelhados) submetidos a duas
situaes experimentais. Com um design no-relacionado no temos uma base que nos permita comparar
diferenas entre pares de resultados. Assim, o teste U de Mann-Whitney ordena os resultados de todos os
sujeitos em ambas as situaes como se fossem apenas um conjunto simples de resultados.

Se as diferenas entre as situaes forem aleatrias, como postulado pela hiptese nula, ento os resultados
devem ser aproximadamente os mesmos e, consequentemente, as ordens devem ser tambm aproximadamente
as mesmas para as duas situaes. Se houver uma preponderncia de ordens altas ou baixas numa situao ou
na outra, ento porque a diferena no total dos resultados ordenados para cada situao devida aos efeitos
previstos da varivel independente e no ao acaso. Se a soma total das ordens for muito baixa para uma das
situaes, ento ter de haver uma preponderncia de ordens elevadas na outra situao. Quanto menor for U
mais significativas sero as diferenas entre as ordens das duas situaes.

INSTRUES PASSO-A-PASSO PARA CALCULAR W

Ordene todos os resultados para ambos os grupos como se se tratasse de um conjunto nico de resultados,
atribuindo a ordem 1 ao resultado inferior e assim sucessivamente.

O ordenamento global de todos os resultados apresentado em Ordens(1) e Ordens (2).

Adicione as ordens totais para o grupo 1 e grupo 2 em separado.

T1=23 e T2=55

Seleccione o maior total das ordens.

T2=55

111
Estatistica e Bioestatstica
2014

Calcule o valor de U atravs da frmula

Nx (nx + 1)
U = n1.n2 + __________________ - Tx,
2

em que:

n1=nmero de sujeitos no grupo 1 n1=6

n2=nmero de sujeitos no grupo 2 n1=6

Tx=maior total de ordens Tx=T2=55

Nx=nmero de sujeitos do grupo com o maior total de ordens Nx=6

Clculo de U

6x7
U = 6 x 6 + _______________ - 55 = 36+21-55=2
2

Quando existe o mesmo nmero de sujeitos em cada situao rapidamente se torna mais fcil verificar qual o
maior total de ordens. Normalmente, prefervel ter um nmero idntico de sujeitos em cada grupo; no entanto,
se tiver de utilizar um nmero desigual de sujeitos em cada grupo, poder faz-lo. Em caso de dvida, calcule U
para ambas as ordens totais, seleccionando o n apropriado a cada caso e, depois, considere o U mais pequeno.

Consulta da significncia na tabela

As Tabelas (Anexo II) apresentam-lhe os valores crticos de U nos diferentes nveis de significncia de testes
unicaudais e bicaudais, para as diferentes combinaes de n1 e n2 dos dois grupos.

O procedimento mais usual comear por verificar se o valor de U significativo ao nvel de significncia de
p<0,05 para testes unicaudais) ou para testes bicaudais. Uma vez que previmos que a tcnica B produzia mais
queixas, poderemos consultar a Tabela para testes unicaudais. Localizando n 1=6 na linha superior e n2=6 na
coluna do lado esquerdo, encontraremos o valor crtico de U na intercepo dos dois.

Concluso: Uma vez que se convencionou utilizar o nvel inferior de U, o nosso valor de U=2 deve ser igual ou
inferior ao valor crtico 7, o que acontece, podemos, desta forma, rejeitar a hiptese nula e aceitar que existem
diferenas significativas ao nvel da dor (p<0,05).

112
Estatistica e Bioestatstica
2014

6. Testes para duas amostras relacionadas

Empregam-se as provas estatsticas de duas amostras quando o investigador deseja determinar se dois
tratamentos so diferentes ou se um tratamento melhor do que o outro. Em cada caso, compara-se o grupo
em que se aplicou o tratamento com outro que no sofreu nenhum tratamento ou que sofreu tratamento
diferente.

Em tais comparaes de dois grupos observam-se, por vezes, diferenas significativas que no so resultantes
do tratamento aplicado.

Uma das maneiras de superar a dificuldade decorrente da introduo de diferenas extrnsecas entre dois
grupos consiste em utilizar na pesquisa duas amostras relacionadas, isto , relacionar de alguma forma as duas
amostras estudadas. Tal relacionamento pode ser conseguido utilizando-se cada indivduo como seu prprio
controlo ou ento formando pares de indivduos e, em seguida, associando os dois membros de cada par s
duas condies. Quando um indivduo serve como o seu prprio controlo, ele submetido a ambos os
tratamentos em ocasies diferentes. Quando se utiliza o mtodo do emparelhamento devem procurar
seleccionar-se, para cada par, indivduos que sejam to semelhantes quanto possvel em relao a quaisquer
variveis extrnsecas que possam influenciar os resultados da pesquisa.

Sempre que possvel, o mtodo de utilizao do indivduo como o seu prprio controlo (contrabalanando a
ordem em que se aplicam os tratamentos ou mtodos) prefervel ao mtodo de emparelhamento. E a razo
disso que limitada a nossa capacidade para formar os pares adequadamente, em consequncia do nosso
desconhecimento das variveis relevantes que determinam o comportamento. A validade por emparelhamento
est na razo directa do investigador para determinar como formar os pares, e essa capacidade quase sempre
muito limitada. Essa dificuldade contornada quando se utiliza cada indivduo como seu prprio controlo; no
se pode pretender relacionamentos mais precisos do que a prpria identidade.

6.1 Prova de mcnemar para a significncia de mudanas

Quando utilizar

A prova de McNemar para a significncia de mudanas particularmente aplicvel aos planeamentos do tipo
antes e depois, em que cada indivduo utilizado como o seu prprio controlo e a mensurao se faz ao nvel
de uma escala nominal ou ordinal. Pode, assim, ser usada para testar a eficincia de determinada tcnica
(reunies, folhetos, visita, etc.) sobre as preferncias eleitorais a respeito de vrios candidatos.

Nestes casos, cada pessoa pode servir como o seu prprio controlo, utilizando-se a mensurao em escala
nominal para avaliar as alteraes da situao aps em relao situao antes.

Exemplo: Suponha que um profissional de sade est interessado em estudar os comportamentos resultantes da
iniciao de obesos prtica do exercicio fisico. Este profissional observou ao longo dos anos que os obesos

113
Estatistica e Bioestatstica
2014
utilizam preferencialmente o elevador para se dirigirem sua consulta cujo consultrio era no 1. andar.
Coloca a hipotese de que os obesos que tiveram com terapeutica exercico fisico comeariam a usar
preferencialmente as escadas. A fim de testar a hipotese o tcnico observa 25 doentes em que ministrou como
exercicio fisico caminhar uma hora por dia cinco vezes por semana. Decorrido um ms de exercicio ele observa
os mesmos 25 doentes e faz a classificao comportamentos. Os dados so os seguintes:

Quadro 16:
Preferencia aps 30 dias de exercicio
Escadas Elevador
Preferncia antes da Elevador 4 (A) 14 (B)
teraputica Escadas 4 (C) 3 (D)

Hiptese de nula:

H0: Para os obesos que modificaram a sua atitude, a probabilidade de mudar o percurso do elevador para as
escadas (PA) igual probabilidade de mudar de mudar das escadas para o elevador (PD) e ambas so iguais
a . Isto ,

H0: PA=PD=1/2 H1: PA>PD

Prova estatstica:

Utiliza-se a prova de McNemar para significncia de mudanas, porque o estudo utiliza duas amostras
relacionadas, do tipo antes-e-depois e utiliza a escala de medida nominal (classificativa).

Nvel de significncia:

p=0,05 N=25

Distribuio amostral:

A distribuio Qui-quadrado com 1 grau de liberdade d uma boa aproximao da distribuio amostral de
Qui-quadrado, tal como calculada pela frmula.

Regio de Rejeio:

Como H1 especifica o sentido da diferena prevista, a regio de rejeio unilateral. Consiste de todos os
valores de Qui-quadrado que so to grandes que acusem uma probabilidade unilateral, associada sua
ocorrncia sob H0 no superior a 0,05.

Deciso:

Estamos interessados nos obesos cujo comportamento acusa alterao: representados nas clulas A e D.

Para os dados, temos:

(A-D - 1)2 (4-3 - 1)2 (1 - 1)2 0


2
X = -------------------- = ---------------- = ------------- = -------- = 0
A+D 4+3 7 7

114
Estatistica e Bioestatstica
2014
2
Sendo 0 valor observado de x =0, devemos consultar a tabela (Anexo I) para obter o valor critico, no
esquecendo que temos uma amostra unicaudal a um nivel de 0,05. consultando a tabela observamos um x2
critico de 5,41.

Racional

Para comparar a significncia de qualquer mudana observada, por este mtodo, constri-se uma tabela de
frequncias de 4 casas para representar o 1 e o 2 conjunto de reaces dos mesmos indivduos. As
caractersticas gerais desta tabela so as que se apresentam a seguir, em que se utilizam os sinais + e -
para indicar diferentes reaces.

Quadro 17: Tabela de quatro casas para a prova de significncia de mudanas


ANTES
- +
DEPOIS + A B
- C D

Note-se que os casos que acusam modificaes entre a 1 e a 2 reaco aparecem nas clulas A e D. Um
indivduo localizado na clula A se passou de + para - e na clula D se passou de - para +. Na
ausncia de modificao, o indivduo classificado na clula B (reaco + antes e depois) ou na clula C
(reaco - antes e depois).

Como A e D representa o nmero total de indivduos que acusam modificao, a perspectiva, sob a hiptese de
nulidade, seria que (A+D) acusassem modificaes num sentido e (A+D) acusassem modificaes noutro
sentido. Ou seja, (A+D) a frequncia esperada, sob H0, tanto na clula A como na clula D.

Na prova de McNemar de significncia de mudana, estamos interessados apenas nas clulas A e D. Portanto,
A=nmero de casos observados na clula A, D=nmero de casos observados na clula D e (A+D)=nmero
esperado de casos tanto nas clulas A como D, ento

(A-D)2
2 _____________
X =
A+D
com graus de liberdade=1

115
Estatistica e Bioestatstica
2014
6.2 Correco de continuidade

A aproximao, pela distribuio do Qui-quadrado, da distribuio amostral da frmula torna-se excelente se


se introduzir uma correco de continuidade. Tal correco necessria, porque se utilizou um distribuio
contnua (Qui-quadrado) para aproximar uma distribuio discreta. Quando todas as frequncias esperadas
so pequenas, tal aproximao pode ser fraca. A correco de continuidade (Yates, 1934) constitui uma
tentativa de remoo dessa fonte de erro.

Com a correco de continuidade, tem-se:

(A-D - 1)2
2 ________________________________
X =
A+D
com graus de liberdade=1

Esta expresso indica que se deve subtrair 1 do valor absoluto da diferena entre A e D antes de elevar ao
quadrado. O grau de significncia de qualquer valor observado de Qui-quadrado, tal como calculado atravs
da frmula, determinado mediante referncia a uma Tabela (Anexo I). Se o valor observado de Qui-quadrado
igual a, ou maior do que, o valor exibido na Tabela para determinado nvel de significncia com gl=1, a
implicao que existe efeito significativo nas reaces antes e depois.

Instrues passo-a-passo para calcular x2

Enquadrar as frequncias observadas numa tabela de 4 casas.

Determinar as frequncias esperadas nas clulas A e D

E=1/2 (A+D)

Se as frequncias esperadas so inferiores a 5, empregar a prova binomial em substituio prova de


McNemar.

Se as frequncias esperadas no so inferiores a 5, calcular o valor de X2 atravs da frmula

(A-D - 1)2
2
X = _______________________
A+D

Mediante referncia Tabela (Anexo I), determinar a probabilidade, sob H0, associado a um valor to grande
quanto o valor observado de X2. Se se trata de uma prova unilateral, dividir por 2 o valor da probabilidade
exibido na Tabela. Se o valor de p, dado pela Tabela para o valor observado de X2 com gl=1, no supera p,
rejeita-se H0 em favor de H1.

116
Estatistica e Bioestatstica
2014

6.3 Teste dos sinais de Wilcoxon

Quando utilizar

O teste de Wilcoxon deve ser utilizado num design experimental relacionado, com duas situaes experimentais
quando so utilizados os mesmos sujeitos ou sujeitos emparelhados em ambas as situaes.

Exemplo: Suponha que quer investigar se existe alguma diferena na quantidade de vocabulrio utilizado por
crianas que usam um aparelho auditivo ou por crianas que no usam. Este um bom exemplo dum caso em
que essencial a utilizao de sujeitos emparelhados. Como bvio, no possvel utilizar os mesmos sujeitos,
uma vez que nenhuma criana que no precisa de usar aparelho auditivo usa um mesmo tempo. Por outro lado,
no podemos escolher aleatoriamente os sujeitos para cada grupo. Pode dar-se o caso, por exemplo, de os
sujeitos que usam aparelho auditivo serem mais velhos. Qualquer efeito encontrado neste grupo pode ficar a
dever-se unicamente a esta diferena. Os dois grupos com aparelho e sem aparelho necessitam de ser
emparelhados em termos de idade, sexo, inteligncia e todas as outras variveis que achemos necessrio serem
controladas. Apresentamos depois s crianas um teste que mea o seu vocabulrio, traduzindo-o em
resultados, tal como mostrado na tabela seguinte.

Quadro 18: Resultados do teste do vocabulrio


Par de Situao A Situao B d (A-B) Ordem de d Ordem das Ordem das
sujeitos (com aparelho) (sem aparelho) diferenas diferenas
positivas negativas
1 3 5 -2 5(-) 5
2 4 5 -1 2(-) 2
3 3 2 +1 2(+) 2
4 1 5 -4 8,5(-) 8,5
5 5 4 +1 2(+) 2
6 2 5 -3 7(-) 7
7 3 5 -2 5(-) 5
8 4 4 0 -
9 1 5 -4 8,5(-) 8,5
10 3 5 -2 5(-) 5
TOTAL 29 45 4 41
MDIA 2,9 4,5

RACIONAL

O objectivo do teste dos sinais de Wilcoxon comparar as performances de cada sujeito (ou pares de sujeitos)
no sentido de verificar se existem diferenas significativas entre os seus resultados nas duas situaes. Os
resultados da Situao B so subtrados dos da Situao A e diferena resultante (d) atribudo o sinal mais
(+) ou, caso seja negativa, o sinal menos (-). Estas diferenas so ordenadas em funo da sua grandeza
(independentemente do sinal positivo ou negativo). O ordenamento assim obtido depois apresentado
separadamente para os resultados positivos e negativos. O menor dos valores deste segundo, d-lhe o valor de
uma estatstica designada por W, que pode ser consultada na Tabela de significncia apropriada.

117
Estatistica e Bioestatstica
2014
A ideia que se existirem apenas diferenas aleatrias, tal como postulado pela hiptese nula, ento haver
aproximadamente o mesmo nmero de ordens elevadas e de ordens inferiores tanto para as diferenas positivas
como negativas. Se se verificar uma preponderncia de baixos resultados para um dos lados, isso significa a
existncia de muitos resultados elevados para o outro lado, indicando uma diferena em favor de uma das
situaes, superior quilo que seria de esperar se os resultados se devessem ao acaso. Dado que a estatstica W
reflecte o menor total de ordens, quanto menor for o W mais significativas sero as diferenas nas ordenaes
entre as duas situaes.

INSTRUES PASSO-A-PASSO PARA CALCULAR W

Calcule a diferena d entre cada par de resultados, atribuindo o sinal mais ou menos.

Veja a coluna d(A-B)

Ordene as diferenas por ordem de grandeza desde a ordem inferior at superior, ignorando os sinais
positivos e negativos.

Veja a coluna ordenamento de d

Em separado, junte tambm a ordenao correspondente aos sinais diferentes (+ ou -).

Veja os totais para ordenamentos de diferenas positivas e de diferenas negativas nas respectivas colunas

Considere o menor dos totais das ordens como W.

Valor observado de W=4, uma vez que o total das ordens para as diferenas positivas o menor

Conte o nmero de pares de sujeitos N (no considere as igualdades).

N=10-1=9

Consulta da significncia na tabela

A tabela anexada (Anexo III) apresenta-lhe o nvel de significncia de w tanto para os testes unicaudais como
bicaudais. Na coluna da esquerda encontra os valores de N. Uma vez que no efectumos uma previso da
direco (como por exemplo, que obteramos melhores resultados no vocabulrio de criana em jardim de
infncia) teremos de utilizar os nveis de significncia para uma hiptese bicaudal. Seleccione o valor adequado
N=9 e verifique ao longo dessa linha se o valor de W significativo. Uma vez que se convencionou utilizar o
menor valor das ordens, ento o valor obtido de W ter de ser igual ou inferior ao valor crtico da Tabela.
Como o valor obtido W=4 inferior ao valor crtico de 6 para p<0,05 (bicaudal), pode rejeitar a hiptese nula
e concluir que existe uma diferena significativa entre os resultados no vocabulrio dos dois grupos de sujeitos
emparelhados.

Suponha que tinha efectuado uma previso numa dada direco, por exemplo, que as crianas que usam
aparelho auditivo (Situao B) obtm resultados mais elevados no teste de vocabulrio. O valor obtido de W=4,
inferior a 6, que o valor crtico de W para p<0,025 (hiptese unicaudal), uma probabilidade inferior e,
consequentemente, mais significativa do que o nvel de significncia para uma hiptese bicaudal p<0,05.

118
Estatistica e Bioestatstica
2014
7. Testes para k amostras independentes
O investigador pode precisar de decidir se diversas variveis independentes devem ser consideradas como
procedentes da mesma populao. Os valores amostrais quase sempre so um tanto diferentes e o problema
determinar se as diferentes amostras observadas sugerem realmente diferenas entre as populaes ou se so
apenas variaes casuais que podem ser esperadas entre amostras aleatrias da mesma populao.

Apresentamos tcnicas para comparar a significncia de diferenas entre trs ou mais grupos de amostras
independentes, ou seja, para comprovar a hiptese de nulidade de que K amostras independentes tenham sido
extradas da mesma populao ou de populaes idnticas.

As provas no-paramtricas tm a vantagem de permitir estudar, quanto significncia, dados que so


inerentemente classificados (escala nominal) ou se apresentam em postos (escala ordinal).

7.1 Teste de Kruskal-Wallis


Requisitos para o uso do teste de kruskal-wallis

O teste de Kruskal-Wallis pressupe as seguintes condies para o seu adequado uso:


Comparao de trs ou mais amostras independentes;
O teste de Kruskal-Wallis no pode ser usado para testar diferenas numa nica amostra de
respondentes mensurados mais de uma vez;
Dados cujo nvel de mensurao seja no mnimo ordinal;
Esta prova exige dados que possam ser ordenados e aos quais, por isso mesmo, seja possvel atribuir
postos ou ordens;
O tamanho mnimo de cada amostra deve ser de 6 para se poder recorrer ao x2.
Quando n > 5 por grupo de respondentes, a significncia de H pode ser determinada por recorrncia
Tabela do Qui-quadrado (Anexo I). Para testar diferenas entre amostras de tamanho inferior a 6, deve
recorrer a tabelas especiais (Anexo IV).

Quando utilizar

Este teste pode ser considerado uma extenso do teste U de Mann-Whitney quando necessitamos de utilizar trs
ou mais situaes. Deve ser utilizado em designs no-relacionados quando sujeitos diferentes so distribudos
por trs ou mais situaes.

Exemplo: Suponha que estamos interessados em descobrir se existem diferenas no acesso a uma pgina da
internet em funo da caracteristica: muito ilustrada, com algumas ilustraes e, sem ilustraes. Alocmos
trs pginas na internet com o mesmo assunto e titulo durante 4 meses. A seguir verificmos o nmero de vezes
que forma acedidas durante quatro sbados seguidos. Os resultados foram.

Quadro 19: Nmero de ideias relembradas para trs tipos de testes


Sujeitos do grupo 1 Sujeitos do grupo 2 Sujeitos do grupo 3
(pgina muito ilustrada) (pgina com algumas (Pgina sem ilustraes)
ilustraes)

Result. Ordem Result. Ordem Result. Ordem


Sabado 1 19 10 14 6 12 3,5
Sabado 2 21 11 15 7 12 3,5
Sabado 3 17 9 9 1 13 5
Sabado 4 16 8 10 2
TOTAL 73 38 38 14 47 14
MDIA 18,25 12,67 11,75

119
Estatistica e Bioestatstica
2014
Racional

Este teste pretende determinar se os resultados so significativamente diferentes para trs ou mais grupos. Uma
vez que todos os resultados foram, em principio, obtidos por sujeitos diferentes a nica forma de verificarmos
as diferenas entre as situaes orden-las em conjunto, como se se tratassem apenas de um conjunto de
resultados, tal como havamos efectuado no teste U de Mann-Whitney. Isto acontece porque, no temos uma
base para comparar resultados dos mesmos sujeitos ou de sujeitos emparelhados em diferentes situaes, como
com o teste U de Mann-Whitney para designs relacionados. Este ordenamento global, quando posteriormente
adicionamos as ordens de cada coluna em separado, permite-nos obter o total das ordens para cada situao.
Se existirem apenas diferenas aleatrias entre as situaes, como postulado na hiptese nula, de esperar
que ordens altas e baixas se distribuam de forma aproximadamente equivalente pelas diferentes situaes. Mas,
se pelo contrrio, houver uma preponderncia de altos ou baixos resultados em qualquer uma das situaes,
provvel que tal facto reflicta diferenas significativas devidas varivel independente.O valor das diferenas
entre os totais das ordens dado pela estatstica designada por H. Desde que a hiptese experimental preveja a
existncia de diferenas significativas entre as situaes, o valor que obtivermos de H dever ser igual ou
superior ao valor crtico da Tabela, para que possa ser considerado significativo.

Instrues passo-a-passo para calcular H

Ordene todos os grupos do design como se se tratasse apenas de um conjunto de resultados, atribuindo a
Ordem 1 ao menor resultado e assim sucessivamente. Para um ordenamento global dos resultados, veja as
colunas ordem para os grupos 1, 2 e 3, em que todos os resultados so considerados em conjunto

Adicione os totais das ordens para cada situao.


Calcule o valor de H a partir da frmula
T 2
12 c
= ________________ __________ - 3 (N + 1)
H
N (N + 1) n
c
em que:

N=nmero total de sujeitos N=11


nc =nmero de sujeitos em cada grupo n1=4; n2=3; n3=4
Tc=total de ordens para cada situao, ou seja, os totais das ordens para cada coluna
T1=38;T2=14;T3=14
Tc2=total das ordens para cada situao, cada um elevado ao quadrado
T12=382;T22=142; T32=142
Tc = soma dos quadrados dos totais das ordens para cada situao dividido
2

nc pelo nmero de sujeitos dessa situao


382/4 + 142/3 + 142/4

Clculo de H
12 T 2
c
= ------------ ----- - 3 (N + 1)
H
N (N + 1) n
c

12
H= -
(382/4 + 142/3 + 142/4 ) - 3 (11 + 1)

11 (11 + 1)

12
H== (1444/4 + 196/3 + 196/4 ) -3 x 12

132

H = 0,91 (361 + 65,33 + 49) 36 H = 43,255 36 = 7,26

Calcule os graus de liberdade, ou seja, o nmero de situaes (C) menos uma.


gl = C 1 = 3 1 = 2

120
Estatistica e Bioestatstica
2014

Consulta da significncia na tabela

A Tabela (Anexo IV) utiliza-se em experincias com trs grupos de sujeitos, e com um mximo de cinco sujeitos
em cada grupo. Para um maior nmero de sujeitos, deve ser utilizada a Tabela do Qui-quadrado (Anexo I).
Quando no so utilizados mais de trs grupos, poder localizar na coluna da esquerda da Tabela o nmero de
sujeitos de cada grupo. Localize ento a combinao que procura (no nosso caso: 4, 4, 3). Note que a ordem do
nmero de sujeitos no importante, mas a combinao apropriada na Tabela 4, 4 e 3. Para essa combinao
encontrar os valores crticos de H para vrias probabilidades. Se o valor de H que obteve for igual ou
superior ao valor crtico de um determinado nvel de significncia pode rejeitar a hiptese nula. No nosso
exemplo, o valor obtido de H=7,26 superior ao valor crtico de 7,1439 para p<0,01, pelo que podemos aceitar
a hiptese experimental a este nvel de significncia.

Se possuir mais de trs situaes, e/ou sujeitos em cada situao, dever procurar o valor crtico na Tabela do
Qui-quadrado. Repare que para isso ter que calcular os graus de liberdade. Localize os valores dos graus de
liberdade (no nosso exemplo, gl=2) ao longo da coluna do lado esquerdo e verifique ao longo da linha os
valores crticos para as diferentes probabilidades. O valor que obtivemos H=7,26 superior ao valor crtico de
5,99 para p<=0,05, pelo que podemos aceitar que o resultado significativo a este nvel. Dar conta que esta
probabilidade menos significativa de que quando utilizamos a Tabela anterior. Isso acontece porque essa
Tabela especialmente concebida para nos dar as probabilidades com um pequeno nmero de sujeitos e de
situaes.

Notar tambm que o teste de Kruskal-Wallis apenas lhe pode dizer que existem diferenas globais nos
resultados entre as situaes experimentais. Na tabela apresentada parece existir uma tendncia para consultar
pginas com mais ilustraes do que sem ilustraes. Mas para poder testar se essa tendncia realmente existe,
ter de utilizar um teste de tendncia.

121
Estatistica e Bioestatstica
2014

8. Testes para k amostras relacionadas

So estatsticas para comprovar a significncia de diferenas entre trs ou mais grupos, ou seja, para
comparar a hiptese de nulidade de que K (3 ou mais) amostras tenham sido extradas da mesma populao ou
de populaes idnticas.

As circunstncias exigem, por vezes, o recurso a um experimento que nos permita estudar simultaneamente
mais de duas amostras ou condies. Quando se trata de comparar trs ou mais amostras ou condies de um
experimento, necessrio aplicar uma prova estatstica que indique se h alguma diferena global entre as K
amostras ou condies, antes que possamos cogitar de comprovar a significncia da diferena entre duas
amostras quaisquer.

S quando uma prova global (prova de K amostras) nos autoriza a rejeitar a hiptese nula que podemos
empregar um processo para determinar diferenas significativas entre duas quaisquer das K amostras.

Estas provas no-paramtricas tm a vantagem de permitir o estudo da significncia de dados que,


inerentemente, se apresentam apenas sob a forma classificativa ou em postos.

H dois planos bsicos para comparar K grupos:

No primeiro deles, as K amostras de igual tamanho so postas em correspondncia de acordo com


determinado(s) critrio(s) que podem afectar os valores das observaes. Nalguns casos, essa correspondncia
obtm-se comparando os mesmos indivduos ou casos sob todas as K condies ou ento cada um dos N grupos
pode ser mensurado sob todas as K condies. Em tais planos, devem usar-se provas estatsticas para K
amostras relacionadas;

O segundo plano envolve K amostras aleatrias independentes (no necessariamente do mesmo tamanho), uma
de cada populao. Em tais casos, devemos usar as provas estatsticas para K amostras independentes.

122
Estatistica e Bioestatstica
2014
8.1 Prova de Cochran

Quando utilizar

A prova de McNemar para duas amostras pode ser estendida para aplicao a pesquisas que envolvem mais de
duas amostras. Essa extenso, que constitui a prova Q de Cochran para K amostras relacionadas, proporciona
um mtodo para comparar se trs ou mais conjuntos correspondentes de frequncias ou propores diferem
entre si significativamente. A correspondncia pode basear-se em caractersticas relevantes dos diferentes
indivduos ou no facto de os mesmos indivduos serem observados sob condies diferentes. A prova Q de
Cochran adapta-se especialmente ao caso em que os dados se apresentam numa escala nominal ou sob a
forma de informao ordinal dicotomizada.

8.2 Teste de Friedman

Quando utilizar

Este teste pode ser considerado uma extenso do teste de Wilcoxon, quando necessrio utilizar trs ou mais
situaes experimentais. Deve ser utilizado para um design relacionado quando os mesmos sujeitos (ou sujeitos
emparelhados) so distribudos por trs ou mais situaes experimentais.

Exemplo: Suponha que um editor de livros de estatistica produziu uma srie de livros e quer escolher de entre
trs tipos de ilustraes aquele que mais eficaz para os estudantes. pedido a oito universitrios que
classifiquem as obras numa escala de cinco pontos, desde nada boa at muito boa. Obtiveram-se os
resultados apresentados na tabela seguinte.

TABELA 14: AVALIAO DE TRS TIPOS DE ILUSTRAES


Sujeitos Situao 1 Situao 2 Situao 3
(Ilustrao (Ilustrao B) (Ilustrao C)
A)
Result. Ordem Result. Ordem Result. Ordem
1 2 1 5 3 4 2
2 1 1 5 3 3 2
3 3 1 5 2,5 5 2,5
4 3 2 5 3 2 1
5 2 1 3 2 5 3
6 1 1 4 2,5 4 2,5
7 5 3 3 2 2 1
8 1 1 4 3 3 2
TOTAL 18 11 34 21 28 16
MDIA 2,25 4,25 3,50

123
Estatistica e Bioestatstica
2014

Racional

Uma vez que se trata de um design relacionado no qual o mesmo sujeito obtm resultados em todas as
situaes, permitido comparar os resultados de cada sujeito atravs de todas as situaes, no sentido de
verificarmos em que situao obtm maiores e menores resultados.

Uma vez que existem mais do que duas situaes, no possvel calcular as diferenas nos resultados de duas
situaes, como era o caso do teste de Wilcoxon. Pelo contrrio, o ordenamento dos resultados de cada sujeito
para as trs condies ser feita horizontalmente ao longo das linhas, tal como mostra a tabela. Por exemplo,
aos resultados do sujeito 1, respectivamente 2 na Situao 1, 5 na Situao 2 e 4 na Situao 3, so atribudas
trs ordens, do menor resultado para o maior: Ordem 1 para a Situao 1, Ordem 2 para a Situao 3 e Ordem
3 para a Situao 2; este procedimento semelhante para todos os sujeitos. Claro que se existissem quatro
situaes experimentais, os resultados de cada sujeito seriam ordenados de 1 a 4.

O prximo passo calcular os totais de ordens para cada situao. Se existirem apenas diferenas aleatrias
entre os resultados de todas as situaes, como postulado pela hiptese nula, de esperar que estes totais
sejam aproximadamente iguais partindo do princpio de que surgiriam algumas ordens baixas (baixos
resultados) e algumas ordens altas (altos resultados). Contudo, se as situaes forem significativamente
diferentes, de esperar que se obtenham totais das ordens significativamente diferentes, com algumas situaes
a terem uma preponderncia de ordens baixas e outras uma preponderncia de ordens altas. O tamanho das
diferenas entre os totais das ordens -nos dado por uma estatstica designada por Xr2. Se o valor de Xr2 for
igual ou superior aos valores crticos das Tabelas C e D (Anexo V), isso implica que as diferenas nos totais
das ordens so suficientemente grandes para que se possam considerar significativas.

Instrues passo-a-passo para calcular w

Ordene os resultados de cada sujeito em separado, ao longo de cada linha, atribuindo a Ordem 1 ao menor
resultado e por a adiante.

(Veja as colunas das Ordens na tabela. Note que a ordem para cada linha de resultados corresponde s ordens
1,2 e 3, dado existirem trs situaes)

Calcule o total das ordens para cada situao.

Calcule o valor de XR2 a partir da frmula

12
2 = ________________________ Tc2 - 3N (C + 1)
XR
NC (C + 1)

em que

C=nmero de situaes C=3

N=nmero de sujeitos N=8

Tc=total de ordens para cada situao T1=11;T2=21;T3=16

Tc2=quadrado do total de ordens para cada situaoT12=112;T22=212; T32=162

Tc2=soma dos quadrados dos totais das ordens para cada situao: 112+212+162

124
Estatistica e Bioestatstica
2014
2
Clculo de XR 12
XR2 = _____________________ (112 + 212 + 162) - 3 x 8 (3 + 1)
(8 x 3) (3 + 1)

12
XR2 = _____________________ (121 + 441 + 256) - (24 x 4)
24 x 4

12
XR2 = _________________ x 818 - 96
96

XR2 = 6,25
Calcule os graus de liberdade, ou seja, o nmero de situaes menos uma.
(gl = C 1 = 3 1 = 2)
Consulta da significncia na tabela

Existem duas tabelas para consultar os valores crticos de Xr 2. Uma delas, a Tabela C (Anexo V), utilizada
quando o nmero de situaes e de sujeitos pequeno. A Tabela C (1) apresenta os valores de Xr2 para trs
situaes quando N (nmero de sujeitos) se situa entre 2 e 9. A Tabela C (2) apresenta os valores de Xr 2 para
quatro situaes quando N (nmero de sujeitos) de 2, 3 ou 4. A Tabela D (Anexo V) a tabela de distribuio
do Qui-quadrado; pode utiliz-la quando a amostra de sujeitos for superior s das Tabelas C (1) e C (2), uma
vez que o Xr2 tem uma distribuio semelhante do Qui-quadrado.

A Tabela que deve utilizar para consultar o valor de Xr2, no caso desta experincia, a Tabela C (1), uma vez
que se trata de 8 sujeitos expostos a 3 situaes experimentais. Aquilo que temos de fazer encontrar a coluna
apropriada para N (nmero de sujeitos ou pares de sujeitos emparelhados) e descobrir na coluna p a
probabilidade mais prxima que seja inferior aos nveis de significncia convencionais. Consultando as
probabilidades para N=8, o valor obtido de Xr2=6,25 equivalente a uma probabilidade de p<0,047, que
inferior aos nveis de significncia convencionais (p<0,05=). Para considerarmos o nvel de significncia de
p<0,01 o nosso valor de Xr2 teria de ser 9,00, dado que p<0,009 inferior a p<0,01. Se o valor de Xr 2 no for
apresentado na Tabela, dever considerar o valor seguinte mais prximo quando consulta as probabilidades.
Por exemplo, se o valor de Xr2 for 5,95 ter de considerar a probabilidade apresentada para 5,25, ou seja,
p<0,079, que superior a p<0,05 e, consequentemente, no significativa. Para consultar os valores da Tabela
C (2) dever proceder tal como para a Tabela C (1).

Se tiver mais situaes e/ou sujeitos e tiver de consultar a Tabela D, aquilo que tem a fazer localizar os
valores dos graus de liberdade ao longo da coluna da esquerda (no nosso exemplo, gl=2, ou seja, nmero de
situaes-1). Depois siga ao longo da linha de probabilidades at que encontre um dos nveis de significncia
convencionais. O valor que obtivemos de Xr2=6,25 superior ao valor crtico de 5,99 apresentado na Tabela do
Qui-quadrado, pelo que podemos aceitar que os nossos resultados so significativos ao nvel de significncia de
p<0,05. Apesar disso, e dado que o nosso valor de Xr2 inferior ao valor crtico de 9,21 para p<0,01, no
podemos rejeitar a hiptese nula a este nvel de significncia.

A partir da anlise estatstica da experincia pode concluir que as crianas mostram preferncias
significativamente diferentes pelos trs tipos de ilustraes. Em funo das mdias apresentadas na tabela,
sabemos que preferem a Ilustrao B, que recolheu as ordens mais elevadas, seguindo-se a Ilustrao C e, por
ltimo, a Ilustrao A. Contudo, o teste de Friedman pode apenas indicar que existem diferenas globais entre
as situaes. Para verificar se existe uma tendncia para uma determinada ordem de preferncia das
Ilustraes, necessita de utilizar um teste de tendncia.

125
Estatistica e Bioestatstica
2014
9. Medidas de correlao e suas provas de significncia

Frequentemente, o investigador quer saber se dois conjuntos de scores esto relacionados e qual o grau desse
relacionamento.

Apresentam-se medidas no-paramtricas de correlao e de provas estatsticas para determinar a


probabilidade associada ocorrncia de uma correlao to grande quanto a observada na amostra, sob a
hiptese de nulidade de que as variveis sejam no-relacionadas na populao.

Mas de muito maior interesse podermos afirmar se determinada associao observada numa amostra de
scores indica, ou no, a probabilidade de associao entre as variveis na populao da qual se extraiu a
amostra. O coeficiente de correlao, por si s, representa o grau de associao. As provas de significncia
sobre aquele coeficiente determinam, a um certo nvel de probabilidade, se existe a associao na populao da
qual se extraiu a amostra que serviu de base para o clculo do coeficiente.

9.1 Coeficiente de correlao rho de spearman-rank

Condies de utilizao

Este tipo de coeficiente de correlao utiliza-se quando temos:

Teste no paramtrico (semelhante a uma distribuio livre), isto , no coloca restries quanto forma da
distribuio;

Escala de medida no mnimo ordinal.

Pode acontecer que os caracteres estudados no sejam mensurveis, mas podem ser ordenados ou
classificados. Por exemplo, se se considera um grupo de candidatos a um certo lugar, eles podem ser
examinados segundo dois pontos de vista: conhecimentos e personalidade. Estas duas qualidades no podem
ser medidas, mas possvel para cada uma delas efectuar uma classificao dos candidatos. Podemos, assim,
examinar se existe correlao entre estes dois caracteres; cada par de dados (xi, yi) formado pelas ordens
ocupadas por um candidato nas duas classificaes.

Formulrio:

6(di2)
=1- ________________

N(N2-1)
Em que:

di= diferena entre as posies nas duas variveis, isto , di=xi-yi

Para tal, temos que dar valores s posies: pontuao mais baixa damos o valor 1 e assim
sucessivamente. Quando os valores so iguais a mdia dessas duas posies.

Ento, -1 1

126
Estatistica e Bioestatstica
2014

Se as duas classificaes so iguais, di sempre zero e ento r=1 e a correlao perfeita. Se as ordens mais
altas de uma classe esto associadas s mais baixas da outra r torna-se negativo e se as duas classificaes so
inversas =-1.

Interpretao

O coeficiente de correlao obtido pode ser interpretado, tal como o coeficiente de correlao momento-
produto de Brawais-Pearson (ver este coeficiente em testes paramtricos).

Exemplo: Calcule , sabendo que:

xi 18 17 14 13 13 12 11 9 7 5

yi 24 27 17 22 19 20 14 11 3 6

Quadro 23:
xi posio yi posio d d2
18 1 24 2 -1 1
17 2 27 1 1 1
14 3 17 6 -3 9
13 4,5 22 3 1,5 2,25
13 4,5 19 5 -0,5 0,25
12 6 20 4 2 4
11 7 14 7 0 0
9 8 11 8 0 0
7 9 3 10 -1 1
5 10 6 9 1 1
=19,5

6 x 19,5
= 1- __________________= 0,88
10(102-1)

9.2 O coeficiente de concordncia de Kendall

Quando utilizar:

O coeficiente de concordncia de Kendall uma medida da relao entre vrios conjuntos de postos de N
objectos ou indivduos.

Quando temos K conjuntos de postos, podemos determinar a associao entre eles utilizando o coeficiente de
concordncia de Kendall (W).

127
Estatistica e Bioestatstica
2014

10 O IBM -SPSS

1. Nvel / Escala de Medida das Variveis


Neste captulo, pretendo classificar as variveis de acordo com o tipo de dados
introduzidos, justificando cada opo.

Variveis Quantitativas: caracterizadas pela sua intensidade, que varia de


elemento para elemento, tornando-a mensurvel ou referencivel.
Exemplos destas variveis:
Idade;
Eco;
PSA;
IPSS;
QoL;
TAC1 e 2.
Variveis Qualitativas: so definidas quando a sua natureza varia de
elemento para elemento. Assumem valores categoriais. E podem ser de natureza:
Nominal quando o seu significado s se entende em funo do nome e o
nmero ou cdigo que se lhe atribua no nos d nenhuma informao.
Ordinais quando existe uma ordenao possvel.

Exemplos destas variveis:


Numero;
Rtup-prvia;
Hormonoterapia;
Reteno_Urinria;
RTUPposterior;
Terapia;
eco2; (NOTA: Esta varivel ordinal).

128
Estatistica e Bioestatstica
2014
2. Transformao de Variveis e Caracterizao da amostra
(algumas variveis)
Como podemos verificar h duas variveis que esto apresentadas de forma
diferente ao habitual, logo, vamos ter de as transformar numa varivel aceitvel.

Essas variveis so:

Educational Level (years);


Gender que est caracterizada como string, e como se deve evitar fazer
estatstica com strings devemos transform-la numa varivel numrica.

2.1. Passar a varavel Educational Level para Habilitaes da forma a que


estamos habituados a ver, como tal:

1 CEB (4 anos de escolaridade)

2 CEB (6 anos de escolaridade)

3 CEB (9 anos de escolaridade)

SEC (12 anos de escolaridade)

Ensino Superior (15 anos de escolaridade)

Mestre (17 anos de escolaridade)

Phd (19 anos de escolaridade)

Transformar variveis:

Tranform Visual Bining Binned Variable: nome da varivel transformada

129
Estatistica e Bioestatstica
2014
Make Labels: mostra os vrios pontos de corte, e diz-nos por exemplo, que nos
anos de escolaridade dos 9 aos 11 anos no existe nenhum funcionrio, onde tem a
linha vermelha.

Paste (e fica criada a nova varivel transformada)

2.2. Transformar a varivel Gender em varivel numrica.

Transform Recode into different variables Name: sexo Old and new
Values

130
Estatistica e Bioestatstica
2014

Temos de alterar os values seno no aparecem na base de dados

2.3. Caracterizao da amostra Varivel Currrent Salary, Varivel Gender e


Varivel Educational Level

NOTA: Nunca se faz tabela de frequncias para variveis quantitativas (tem de se


tirar a seleco do display frequence table)

Salrio (varivel quantitativa)

Analyse Descriptive StatisticsFrequencies

131
Estatistica e Bioestatstica
2014

132
Estatistica e Bioestatstica
2014

Statistics
Current Salary
N Valid 474
Missing 0
Mean $34,419.57
Median $28,875.00
Mode $30,750
Std. Deviation $17,075.661
Variance 2,916E8
Minimum $15,750
Maximum $135,000

Nesta situao pode-se fazer o histograma porque Salrio uma varivel


quantitativa e contnua (no tem casas decimais). A distribuio enviesada
esquerda, ou assimtrica negativa.

Se quisermos fazer s as descriptives de uma forma muito mais rpida para


variveis quantitativas fazemos e d-nos apenas o seguinte:

Descriptive Statistics
N Minimum Maximum Mean Std. Deviation
Current Salary 474 $15,750 $135,000 $34,419.57 $17,075.661
Valid N (listwise) 474

133
Estatistica e Bioestatstica
2014
Gender (sexo) e Habilitaes (a varvel transformada) Ambas Qualitativas

Como so qualitativas s se vai fazer display frequency tables, no possvel


calcular as medidas de tendncia central.

3. Estatstica Inferencial

Estratgia estatstica de anlise de dados:

1 Examinar o estudo, identificar o que se quer com a anlise estatstica,


especificando as vrias questes a que se quer que a anlise estatstica responda
(conhecer a associao ou verificar as diferenas).

134
Estatistica e Bioestatstica
2014
2 Identificar a varivel dependente e independente bem como os seus nveis de
mensurao.

3 Na escolha da estatstica apropriada, verificar se a varivel dependente


adequada estatstica paramtrica.

Pr-requisitos da Estatstica Paramtrica:

1. Varivel Dependente ser quantitativa (no caso de correlao a


varivel dependente e tambm a independente);
2. Ser simtrica (Skewness tem de estar entre -2 e 2);
3. Ser mesocrtica (Kurtosis tem de estar entre -2 e 2);
4. Ter distribuio normal (Tests of normality: Kolmogorov-Smirnov (para
mais de 50 casos) e Shapiro-Wilk (menor numero de casos)).
Sig 0,05 Rejeito Ho, logo no tem distribuio normal.

3.1. Verificar se h uma distribuio diferente relativamente aos anos de


escolaridade

NOTA: Verificar se utilizamos a Estatstica Paramtrica para a varivel Educational


Level (years)

Analyse Descriptive Statistics Explore Plots

135
Estatistica e Bioestatstica
2014

Case Processing Summary


Cases
Valid Missing Total
N Percent N Percent N Percent
Educational Level (years) 474 100,0% 0 ,0% 474 100,0%

Descriptives

Statistic Std. Error


Educational Mean 13,49 ,133
Level
(years) 95% Lower 13,23
Confidence Bound
Interval for Upper 13,75
Mean Bound
5% Trimmed Mean 13,48
Median 12,00
Variance 8,322 Skewness= Statistic / Std. Error
Std. Deviation 2,885
Minimum 8 Kurtosis = Statistic / Std. Error
Maximum 21
Range 13
Interquartile Range 3
Skewness -,114 ,112 -1,0174
Kurtosis -,265 ,224 -1,18386

Tests of Normality
Kolmogorov-Smirnova Shapiro-Wilk
Statistic df Sig. Statistic df Sig.
Educational Level (years) ,210 474 ,000 ,906 474 ,000

Pr-requisitos Paramtrica:

1. A variavel quantitativa
2. simtrica, o Skewness est entre -2 e 2
3. mesocrtica, o Kurtosis est entre -2 e 2
4. Tem distribuio normal?

Como a amostra tem mais de 50 casos vamos utilizar o Kolmogorov-Smirnov (Tests


of Normality). Sig = 0,000 < = 0,05, rejeito H0, logo a distribuio no normal, no
podemos usar a Estatstica Paramtrica.

136
Estatistica e Bioestatstica
2014

3.2. H1: Saber se esta profisso mais masculina ou feminina

S existe uma varivel nesta hiptese experimental que o sexo (varivel


nominal), logo, o teste a se usar o Qui-Quadrado da Aderncia.

Qui-Quadrado da Aderncia:
Consiste em comparar os dados obtidos experimentalmente com os dados
esperados de acordo com a lei.
O Qui-quadrado da aderncia aplica-se quando se tem uma varivel qualitativa
nominal (ou tratada como tal) e se pretende verificar se esta segue uma dada
distribuio (uniforme, por exemplo).

Analyse Non parametric Tests Legacy Dialogs Chi-Square

Concluso: Sig = 0,054 > = 0,05,


logo aceito Ho, no h diferenas
entre os 2 sexos, no se pode dizer
que esta profisso mais para
homens ou mais para mulheres.

137
Estatistica e Bioestatstica
2014
3.3. H2: Existem diferenas de anos de escolaridade em funo da categoria
profissional

Teste de diferenas de mdias, para a varivel independente Employment Category


(Categoria Profissional). Esta varivel tem 3 amostras: Clerical (estagirio),
Custodial (Contratado) e Manager (Chefias), logo vou fazer o Teste H de Kruskal-
Wallis, porque a estatstica no paramtrica e o Teste ANOVA supondo que a
estatstica era Paramtrica.

Teste H de Kruskal-Wallis:

Aplica-se para comparar trs ou mais distribuies de populaes independentes.


Na prtica uma anlise de varincia a um factor (One-way ANOVA), mas no-
paramtrica. Recorre-se a este teste quando se tm dois ou mais grupos
independentes, definidos por uma varivel qualitativa nominal ou tratada como tal,
para os quais se pretende testar a igualdade de mdias, quando a varivel de teste
quantitativa e no esto verificados os pressupostos paramtricos ou testar a
igualdade das distribuies dos k grupos atravs das suas ordenaes (rankings),
quando a varivel de teste qualitativa ordinal.

Analyse Non parametric tests Legacy dialogs K independent samples

138
Estatistica e Bioestatstica
2014

Concluso: Sig = 0,000 < = 0,05, logo rejeito H0, existem diferenas nas
habilitaes em funo das categorias. Os estagirios e as chefias tm muito
maiores habilitaes que os contratados.

ANOVA:

Aplica-se quando se tem uma varivel quantitativa (dependente) e se pretende


comparar a sua mdia em dois ou mais grupos populacionais independentes
definidos por uma varivel qualitativa. uma extenso do teste T de Student para
amostras independentes.
O Post-Hoc (testes de comparaes mltiplas posteriori) identifica se cada par de
grupos tem ou no mdias significativamente diferentes, logo s se aplica um teste
Post-Hoc quando se rejeita Ho, ou seja, quando h diferenas significativas entre os
grupos estudados, e sendo assim vamos fazer as comparaes utilizando vrios
tipos de testes, em que a diferena entre eles reside no tipo de distribuio em que
assentam e no tipo de ajustamento.
Testes Conservadores quando temos valores que variam de 0 a 1000, tem
de ter uma diferena grande para considerar significativa (ex: Scheffe)
Testes Liberais existe uma diferena mnima (quando a amplitude de
valores pequena (ex: LSD)
Testes Moderados ex: Tukey

139
Estatistica e Bioestatstica
2014
Analyse Compare Means One-Way Anova

Como um teste Moderado escolhemos


o Tukey, como teste Post-Hoc.

140
Estatistica e Bioestatstica
2014

Concluso: Sig = 0,000 < = 0,05, rejeito Ho, logo h diferenas entre os anos de
escolaridade e a categoria profissional. Os estagirios tm em mdia 13 anos de
escolaridade, os contratados 10 anos de escolaridade e as chefias 17 anos de
escolaridade.

3.4. H3: Quanto maior a escolaridade maior a categoria profissional

um teste de correlao, e como um teste No Paramtrico vou usar o Teste


RHO de Spearman. E supondo que era um teste Paramtrico vou usar o Teste de
R de Pearson.

141
Estatistica e Bioestatstica
2014

Teste RHO de Spearman:

O rho de Spearman aplica-se quando se pretende testar se a relao entre duas


variveis existe. As duas variveis so, pelo menos, ordinais. E mede a associao
entre as ordenaes das duas variveis.

Para Bryman e Cramer (1995), citando Cohen e Holliday (1982) se:


0,2 - Correlao muito fraca e sem significncia.
0,2 < r - 0,39 Correlao fraca.
0,4 < r - 0,69 Correlao moderada.
0,7 < r - 0,89 Correlao forte.
0,9 < r 1 - Correlao muito forte.
Analyse Correlate Bivariate

Correlations
Educational
Employment Level (years)
Category (Binned)
**
Spearman's rho Employment Category Correlation Coefficient 1,000 ,419
Sig. (2-tailed) . ,000
N 474 474
**
Educational Level (years) Correlation Coefficient ,419 1,000
(Binned) Sig. (2-tailed) ,000 .
N 474 474
**. Correlation is significant at the 0.01 level (2-tailed).

Concluso: Sig = 0,000 < = 0,05, rejeito Ho, logo, existe correlao entre a
escolaridade e a categoria profissional. Como r = 0,419, o tipo de correlao
moderada.

142
Estatistica e Bioestatstica
2014

Teste R de Pearson

Utiliza-se quando as duas variveis so contnuas, a distribuio aproxima-se da


distribuio normal. uma escala intervalar de medida, e prefervel para
distribuies unimodais.

Analyse Correlate Bivariate Pearson

Concluso: Sig = 0,000 < = 0,05, rejeito Ho, logo, existe correlao entre a
escolaridade e a categoria profissional. Como r = 0,477, o tipo de correlao
moderada.

143
Estatistica e Bioestatstica
2014
3.5. H4: Em termos proporcionais as chefias tm mais habilitaes

O teste para esta hiptese o Qui-quadrado da independncia, visto ter 2


variveis e ser um teste de diferena de propores.

Qui-Quadrado da independncia:

O Qui-quadrado da independncia serve para ajudar a decidir se as duas variveis


esto ao no presas uma outra por uma relao de dependncia. O teste
compara o nmero de sujeitos que se distribuem por uma determinada categoria
com o nmero de sujeitos que se esperaria se distribussem por essa mesma
categoria, caso no existissem diferenas.

Analyse Descriptives Statistics Crosstabs

Seleccionar as
variveis pretendidas
tendo em ateno em
colocar em Row a
varivel dependente e
em Column a varivel
independente.

144
Estatistica e Bioestatstica
2014

Concluso: Sig = 0,000 < = 0,05, rejeito Ho, logo, as variveis so dependentes.
As chefias em termos proporcionais tm mais habilitaes, a maioria est acima dos
19 anos de escolaridade, enquanto que os estagirios esto entre os 12 e 14 anos
de escolaridade, e os contratados entre os 9 e 14 anos de escolaridade.

145
Estatistica e Bioestatstica
2014

3.6. H5: Existem diferenas de escolaridades nos diferentes sexos, se


as mulheres tm mais escolaridade que os homens

um teste de diferenas de mdias, logo vou fazer o teste para a estatstica


No Paramtrica, Teste de U de Mann-Whitney e para a Estatstica Paramtrica,
Teste T de Student para dados independentes supondo que esta tem os
pressuposto todos cumpridos.

Teste de U de Mann-Whitney

Aplica-se quando se pretende testar a igualdade de duas distribuies


populacionais (varivel quantitativa ou qualitativa ordinal). De outra forma, permite
comparar as mdias das ordenaes de duas amostras aleatrias independentes.
utilizado como alternativa ao teste T (paramtrico) para a igualdade de duas mdias
de amostras independentes, quando este no se pode aplicar por violao dos seus
pressupostos (nomeadamente o da normalidade) ou como primeira opo quando a
varivel em teste qualitativa ordinal ou tratada como tal.

Analyse Nonparametric Tests Legacy Dialogs 2 Independent Samples

146
Estatistica e Bioestatstica
2014

Concluso: Sig = 0,000 < = 0,05, rejeito Ho, logo, h diferenas entre as
escolaridades dos homens e a escolaridade das mulheres.

Teste T de Student para dados independentes

Aplica-se quando se tem uma varivel quantitativa (dependente) e se pretende


comparar a sua mdia em dois grupos populacionais independentes definidos por
uma varivel qualitativa (independente).

Analyse Compare Means Independent Samples T test

147
Estatistica e Bioestatstica
2014

Concluso: Sig = 0,000 < = 0,05, rejeito Ho, logo, h diferenas entre as
escolaridades dos homens e a escolaridade das mulheres. Em mdia as mulheres
tm 12 anos de escolaridade e os homens tm 14 anos de escolaridade, logo,
rejeitamos a hiptese experimental, as mulheres que trabalham nesta empresa no
tm mais anos de escolaridade que os homens.

3.7. H6: Existem diferenas entre o salrio actual e o inicial

um teste de diferenas de mdias entre duas amostras para dados


emparelhados, como tal, usarei o Teste de W de Wilcoxon para Estatstica No
Paramtrica e o Teste de T de Student para dados emparelhados, supondo que
este teste era de Estatstica Paramtrica.

148
Estatistica e Bioestatstica
2014

Teste de W de Wilcoxon

Aplica-se quando se pretende testar a igualdade de duas distribuies populacionais


ou, de outra forma, permite comparar as mdias das ordenaes (mean ranks) das
duas distribuies. utilizado como uma alternativa ao teste paramtrico T de
student para dados emparelhados, quando este no se pode aplicar por violao
dos seus pressupostos, ou como primeira opo, quando a varivel em teste
qualitativa ordinal ou tratada como tal.

Analyse Nonparametric Testes Legacy Dialogs 2 Related Samples

Concluso: Sig = 0,000 < = 0,05, rejeito Ho, existem diferenas de salrio desde
que entraram ao servio em comparao como o salrio que tm hoje em dia.
Quando entraram na empresa ganhavam menos do que agora. Logo, aceitamos a
hiptese experimental.

149
Estatistica e Bioestatstica
2014
Teste T de Student para dados emparelhados

Aplica-se quando se tem duas variveis quantitativas correlacionadas (medidas em


escalas comparveis) e se pretende comparar as suas mdias para os mesmos
sujeitos. Quando os mesmos sujeitos so usados em ambas as situaes podem
comparar-se pares de resultados obtidos por cada indivduo quando sujeito a ambas
as situaes.

Analyse Compare Means Paired-Samples T Test

Concluso: Sig = 0,000 < = 0,05, rejeito Ho, existem diferenas de salrio desde
que entraram ao servio em comparao como o salrio que tm hoje em dia.
Quando entraram na empresa ganhavam menos do que agora. Logo, aceitamos a
hiptese experimental.

150
Estatistica e Bioestatstica
2014

Anexos

151
Estatistica e Bioestatstica
2014

Anexo I Tabela do Quiquadrado (x2):Valores crticos


gl 0,995 0,99 0,975 0,95 0,9 0,1 0,05 0,025 0,01 0,005
1 0,000 0,000 0,001 0,004 0,016 2,706 3,841 5,024 6,635 7,879
2 0,010 0,020 0,051 0,103 0,211 4,605 5,991 7,378 9,210 10,597
3 0,072 0,115 0,216 0,352 0,584 6,251 7,815 9,348 11,345 12,838
4 0,207 0,297 0,484 0,711 1,064 7,779 9,488 11,143 13,277 14,860
5 0,412 0,554 0,831 1,145 1,610 9,236 11,070 12,832 15,086 16,750
6 0,676 0,872 1,237 1,635 2,204 10,645 12,592 14,449 16,812 18,548
7 0,989 1,239 1,690 2,167 2,833 12,017 14,067 16,013 18,475 20,278
8 1,344 1,647 2,180 2,733 3,490 13,362 15,507 17,535 20,090 21,955
9 1,735 2,088 2,700 3,325 4,168 14,684 16,919 19,023 21,666 23,589
10 2,156 2,558 3,247 3,940 4,865 15,987 18,307 20,483 23,209 25,188
11 2,603 3,053 3,816 4,575 5,578 17,275 19,675 21,920 24,725 26,757
12 3,074 3,571 4,404 5,226 6,304 18,549 21,026 23,337 26,217 28,300
13 3,565 4,107 5,009 5,892 7,041 19,812 22,362 24,736 27,688 29,819
14 4,075 4,660 5,629 6,571 7,790 21,064 23,685 26,119 29,141 31,319
15 4,601 5,229 6,262 7,261 8,547 22,307 24,996 27,488 30,578 32,801
16 5,142 5,812 6,908 7,962 9,312 23,542 26,296 28,845 32,000 34,267
17 5,697 6,408 7,564 8,672 10,085 24,769 27,587 30,191 33,409 35,718
18 6,265 7,015 8,231 9,390 10,865 25,989 28,869 31,526 34,805 37,156
19 6,844 7,633 8,907 10,117 11,651 27,204 30,144 32,852 36,191 38,582
20 7,434 8,260 9,591 10,851 12,443 28,412 31,410 34,170 37,566 39,997
21 8,034 8,897 10,283 11,591 13,240 29,615 32,671 35,479 38,932 41,401
22 8,643 9,542 10,982 12,338 14,041 30,813 33,924 36,781 40,289 42,796
23 9,260 10,196 11,689 13,091 14,848 32,007 35,172 38,076 41,638 44,181
24 9,886 10,856 12,401 13,848 15,659 33,196 36,415 39,364 42,980 45,558
25 10,520 11,524 13,120 14,611 16,473 34,382 37,652 40,646 44,314 46,928
26 11,160 12,198 13,844 15,379 17,292 35,563 38,885 41,923 45,642 48,290
27 11,808 12,878 14,573 16,151 18,114 36,741 40,113 43,195 46,963 49,645
28 12,461 13,565 15,308 16,928 18,939 37,916 41,337 44,461 48,278 50,994
29 13,121 14,256 16,047 17,708 19,768 39,087 42,557 45,722 49,588 52,335
30 13,787 14,953 16,791 18,493 20,599 40,256 43,773 46,979 50,892 53,672
31 14,458 15,655 17,539 19,281 21,434 41,422 44,985 48,232 52,191 55,002
32 15,134 16,362 18,291 20,072 22,271 42,585 46,194 49,480 53,486 56,328
33 15,815 17,073 19,047 20,867 23,110 43,745 47,400 50,725 54,775 57,648
34 16,501 17,789 19,806 21,664 23,952 44,903 48,602 51,966 56,061 58,964
35 17,192 18,509 20,569 22,465 24,797 46,059 49,802 53,203 57,342 60,275
36 17,887 19,233 21,336 23,269 25,643 47,212 50,998 54,437 58,619 61,581
37 18,586 19,960 22,106 24,075 26,492 48,363 52,192 55,668 59,893 62,883
38 19,289 20,691 22,878 24,884 27,343 49,513 53,384 56,895 61,162 64,181
39 19,996 21,426 23,654 25,695 28,196 50,660 54,572 58,120 62,428 65,475
40 20,707 22,164 24,433 26,509 29,051 51,805 55,758 59,342 63,691 66,766

152
Estatistica e Bioestatstica
2014

Anexo II - Tabela de U para 0,05

n2

n1 3 4 5 6 7 8

3 0 0 1 2 2 3

4 1 2 3 4 5

5 4 5 6 8

6 7 8 10

7 11 13

8 15
Note: The table gives critical values for rejecting, as having a probability of 0.05 or less, the null hypotheses
that the average values of the majority group and the minority group are the same.

153
Estatistica e Bioestatstica
2014
Tabela Z

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,00000 0,00399 0,00798 0,01197 0,01595 0,01994 0,02392 0,02790 0,03188 0,03586
0,1 0,03983 0,04380 0,04776 0,05172 0,05567 0,05962 0,06356 0,06749 0,07142 0,07535
0,2 0,07926 0,08317 0,08706 0,09095 0,09483 0,09871 0,10257 0,10642 0,11026 0,11409
0,3 0,11791 0,12172 0,12552 0,12930 0,13307 0,13683 0,14058 0,14431 0,14803 0,15173
0,4 0,15542 0,15910 0,16276 0,16640 0,17003 0,17364 0,17724 0,18082 0,18439 0,18793
0,5 0,19146 0,19497 0,19847 0,20194 0,20540 0,20884 0,21226 0,21566 0,21904 0,22240
0,6 0,22575 0,22907 0,23237 0,23565 0,23891 0,24215 0,24537 0,24857 0,25175 0,25490
0,7 0,25804 0,26115 0,26424 0,26730 0,27035 0,27337 0,27637 0,27935 0,28230 0,28524
0,8 0,28814 0,29103 0,29389 0,29673 0,29955 0,30234 0,30511 0,30785 0,31057 0,31327
0,9 0,31594 0,31859 0,32121 0,32381 0,32639 0,32894 0,33147 0,33398 0,33646 0,33891
1,0 0,34134 0,34375 0,34614 0,34849 0,35083 0,35314 0,35543 0,35769 0,35993 0,36214
1,1 0,36433 0,36650 0,36864 0,37076 0,37286 0,37493 0,37698 0,37900 0,38100 0,38298
1,2 0,38493 0,38686 0,38877 0,39065 0,39251 0,39435 0,39617 0,39796 0,39973 0,40147
1,3 0,40320 0,40490 0,40658 0,40824 0,40988 0,41149 0,41308 0,41466 0,41621 0,41774
1,4 0,41924 0,42073 0,42220 0,42364 0,42507 0,42647 0,42785 0,42922 0,43056 0,43189
1,5 0,43319 0,43448 0,43574 0,43699 0,43822 0,43943 0,44062 0,44179 0,44295 0,44408
1,6 0,44520 0,44630 0,44738 0,44845 0,44950 0,45053 0,45154 0,45254 0,45352 0,45449
1,7 0,45543 0,45637 0,45728 0,45818 0,45907 0,45994 0,46080 0,46164 0,46246 0,46327
1,8 0,46407 0,46485 0,46562 0,46638 0,46712 0,46784 0,46856 0,46926 0,46995 0,47062
1,9 0,47128 0,47193 0,47257 0,47320 0,47381 0,47441 0,47500 0,47558 0,47615 0,47670
2,0 0,47725 0,47778 0,47831 0,47882 0,47932 0,47982 0,48030 0,48077 0,48124 0,48169
2,1 0,48214 0,48257 0,48300 0,48341 0,48382 0,48422 0,48461 0,48500 0,48537 0,48574

2,2 0,48610 0,48645 0,48679 0,48713 0,48745 0,48778 0,48809 0,48840 0,48870 0,48899
2,3 0,48928 0,48956 0,48983 0,49010 0,49036 0,49061 0,49086 0,49111 0,49134 0,49158
2,4 0,49180 0,49202 0,49224 0,49245 0,49266 0,49286 0,49305 0,49324 0,49343 0,49361
2,5 0,49379 0,49396 0,49413 0,49430 0,49446 0,49461 0,49477 0,49492 0,49506 0,49520
2,6 0,49534 0,49547 0,49560 0,49573 0,49585 0,49598 0,49609 0,49621 0,49632 0,49643
2,7 0,49653 0,49664 0,49674 0,49683 0,49693 0,49702 0,49711 0,49720 0,49728 0,49736
2,8 0,49744 0,49752 0,49760 0,49767 0,49774 0,49781 0,49788 0,49795 0,49801 0,49807
2,9 0,49813 0,49819 0,49825 0,49831 0,49836 0,49841 0,49846 0,49851 0,49856 0,49861
3,0 0,49865 0,49869 0,49874 0,49878 0,49882 0,49886 0,49889 0,49893 0,49896 0,49900
3,1 0,49903 0,49906 0,49910 0,49913 0,49916 0,49918 0,49921 0,49924 0,49926 0,49929
3,2 0,49931 0,49934 0,49936 0,49938 0,49940 0,49942 0,49944 0,49946 0,49948 0,49950
3,3 0,49952 0,49953 0,49955 0,49957 0,49958 0,49960 0,49961 0,49962 0,49964 0,49965
3,4 0,49966 0,49968 0,49969 0,49970 0,49971 0,49972 0,49973 0,49974 0,49975 0,49976
3,5 0,49977 0,49978 0,49978 0,49979 0,49980 0,49981 0,49981 0,49982 0,49983 0,49983
3,6 0,49984 0,49985 0,49985 0,49986 0,49986 0,49987 0,49987 0,49988 0,49988 0,49989
3,7 0,49989 0,49990 0,49990 0,49990 0,49991 0,49991 0,49992 0,49992 0,49992 0,49992
3,8 0,49993 0,49993 0,49993 0,49994 0,49994 0,49994 0,49994 0,49995 0,49995 0,49995
3,9 >0,49995 etc ...

z 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

154
Estatistica e Bioestatstica
2014

Tabela da Distribuio Normal Padro


P(Z<z)
z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998
3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
P(Z<z)

155
Estatistica e Bioestatstica
2014

z 0,0 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,4960 0,4920 0,4880 0,4840 0,4801 0,4761 0,4721 0,4681 0,4641
-0,1 0,4602 0,4562 0,4522 0,4483 0,4443 0,4404 0,4364 0,4325 0,4286 0,4247
-0,2 0,4207 0,4168 0,4129 0,4090 0,4052 0,4013 0,3974 0,3936 0,3897 0,3859
-0,3 0,3821 0,3783 0,3745 0,3707 0,3669 0,3632 0,3594 0,3557 0,3520 0,3483
-0,4 0,3446 0,3409 0,3372 0,3336 0,3300 0,3264 0,3228 0,3192 0,3156 0,3121
-0,5 0,3085 0,3050 0,3015 0,2981 0,2946 0,2912 0,2877 0,2843 0,2810 0,2776
-0,6 0,2743 0,2709 0,2676 0,2643 0,2611 0,2578 0,2546 0,2514 0,2483 0,2451
-0,7 0,2420 0,2389 0,2358 0,2327 0,2296 0,2266 0,2236 0,2206 0,2177 0,2148
-0,8 0,2119 0,2090 0,2061 0,2033 0,2005 0,1977 0,1949 0,1922 0,1894 0,1867
-0,9 0,1841 0,1814 0,1788 0,1762 0,1736 0,1711 0,1685 0,1660 0,1635 0,1611
-1,0 0,1587 0,1562 0,1539 0,1515 0,1492 0,1469 0,1446 0,1423 0,1401 0,1379
-1,1 0,1357 0,1335 0,1314 0,1292 0,1271 0,1251 0,1230 0,1210 0,1190 0,1170
-1,2 0,1151 0,1131 0,1112 0,1093 0,1075 0,1056 0,1038 0,1020 0,1003 0,0985
-1,3 0,0968 0,0951 0,0934 0,0918 0,0901 0,0885 0,0869 0,0853 0,0838 0,0823
-1,4 0,0808 0,0793 0,0778 0,0764 0,0749 0,0735 0,0721 0,0708 0,0694 0,0681
-1,5 0,0668 0,0655 0,0643 0,0630 0,0618 0,0606 0,0594 0,0582 0,0571 0,0559
-1,6 0,0548 0,0537 0,0526 0,0516 0,0505 0,0495 0,0485 0,0475 0,0465 0,0455
-1,7 0,0446 0,0436 0,0427 0,0418 0,0409 0,0401 0,0392 0,0384 0,0375 0,0367
-1,8 0,0359 0,0351 0,0344 0,0336 0,0329 0,0322 0,0314 0,0307 0,0301 0,0294
-1,9 0,0287 0,0281 0,0274 0,0268 0,0262 0,0256 0,0250 0,0244 0,0239 0,0233
-2,0 0,0228 0,0222 0,0217 0,0212 0,0207 0,0202 0,0197 0,0192 0,0188 0,0183
-2,1 0,0179 0,0174 0,0170 0,0166 0,0162 0,0158 0,0154 0,0150 0,0146 0,0143
-2,2 0,0139 0,0136 0,0132 0,0129 0,0125 0,0122 0,0119 0,0116 0,0113 0,0110
-2,3 0,0107 0,0104 0,0102 0,0099 0,0096 0,0094 0,0091 0,0089 0,0087 0,0084
-2,4 0,0082 0,0080 0,0078 0,0075 0,0073 0,0071 0,0069 0,0068 0,0066 0,0064
-2,5 0,0062 0,0060 0,0059 0,0057 0,0055 0,0054 0,0052 0,0051 0,0049 0,0048
-2,6 0,0047 0,0045 0,0044 0,0043 0,0041 0,0040 0,0039 0,0038 0,0037 0,0036
-2,7 0,0035 0,0034 0,0033 0,0032 0,0031 0,0030 0,0029 0,0028 0,0027 0,0026
-2,8 0,0026 0,0025 0,0024 0,0023 0,0023 0,0022 0,0021 0,0021 0,0020 0,0019
-2,9 0,0019 0,0018 0,0018 0,0017 0,0016 0,0016 0,0015 0,0015 0,0014 0,0014
-3,0 0,0013 0,0013 0,0013 0,0012 0,0012 0,0011 0,0011 0,0011 0,0010 0,0010
-3,1 0,0010 0,0009 0,0009 0,0009 0,0008 0,0008 0,0008 0,0008 0,0007 0,0007
-3,2 0,0007 0,0007 0,0006 0,0006 0,0006 0,0006 0,0006 0,0005 0,0005 0,0005
-3,3 0,0005 0,0005 0,0005 0,0004 0,0004 0,0004 0,0004 0,0004 0,0004 0,0003
-3,4 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0003 0,0002
-3,5 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002 0,0002
-3,6 0,0002 0,0002 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,7 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,8 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001 0,0001
-3,9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000

156
Estatistica e Bioestatstica
2014

Anexo III Tabela de Wilcoxon Valores crticos:

Wilcoxon Signed-Ranks Test Critical values


Number (n) 2 sided 1 sided
6 0 2
7 2 3
8 3 5
9 5 8
10 8 10
11 10 13
12 13 17
13 17 21
14 21 25
15 25 30
16 29 35
17 34 41
18 40 47
19 46 53
20 52 60
21 58 67
22 65 75
23 73 83
24 81 91
25 89 100
Critical values: Wilcoxon Signed-Ranks test p=0.05 (CI% = 95%). Significant, if the calculated values
presented in this table [the sum of the positive ranks or the negative ranks] is too small.

157
Estatistica e Bioestatstica
2014

Anexo IV - Tabela H - n<5

If the sample sizes are 5 or more then H is a 2 distribution with degrees of freedom (k 1).

For a chi-squared distribution, the following table is needed:

Chi-Squared Table

158
Estatistica e Bioestatstica
2014

Anexo V - Tabelas A a D (Tabelas de Friedman)

Testa a hiptese de que vrios grupos relacionados tm, todos, a mesma distribuio uma alternativa par a
anlise de varincia com duas classificaes.

Aplicar este teste se possuir poucos dados amostrais e/ou as pressuposies, exigidas pela anlise de varincia,
estiverem seriamente comprometidas.

Exigncia: as observaes precisam ser medidas pelo menos em escala ordinal.

12 k
Fr R 2j 3N (k 1)
Nk (k 1) j 1

Valores Crticos para a anlise de varincia por nmero de ordem de Friedman*

k N 0.10 0.05 0.01


3 3 6.00 6.00
4 6.00 6.50 8.00
5 5.20 6.40 8.40
6 5.33 7.00 9.00
7 5.43 7.14 8.86
8 5.25 6.25 9.00
9 5.56 6.22 8.67
10 5.00 6.20 9.60
11 4.91 6.54 8.91
12 5.17 6.17 8.67
13 4.77 6.00 9.39

4.61 5.99 9.21


4 2 6.00 6.00
3 6.60 7.40 8.60
4 6.30 4.80 9.60
5 6.36 7.80 9.96
6 6.40 7.60 10.00
7 6.26 7.80 10.37
8 6.30 7.50 10.35

6.25 7.82 11.34


5 3 7.47 8.53 10.13
4 7.60 8.80 11.00
5 7.68 8.96 11.52

7.78 9.49 13.28


* Adaptado de Siegel, S. e Castellan Jr., N. J. Nonparametric statistics for the Behavioral Sciences, McGraw-
Hill, 1988

159
Estatistica e Bioestatstica
2014
Anexo VI - rho de spearman
There are several kinds of correlation coefficient. The Spearman rank correlation coefficient demonstrated

6 2 6
[] = 1
( 21)
ou [] = 1
( 21)
SRDS is the 'sum of rank differences squared,

To decide if the coefficient's value is significant (i.e. if the correlation is meaningful), look up the critical value
in the following table:

N critical value
5 0.9
6 0.829
7 0.714
8 0.643
9 0.6
10 0.564
12 0.506
16 0.425
20 0.377
Then compare the absolute value of the coefficient with the critical value. If the calculated value exceeds the
critical value, then the correlation coefficient is significant. (To get the 'absolute' value of a negative value,
replace the negative sign by a positive sign.)

160
Estatistica e Bioestatstica
2014

Anexo VII Tabela E- Valores crticos da distribuio de Chi- Quadrado


G.L. 0,1 0,05 0,01
1 2,71 3,84 6,63
2 4,61 5,99 9,21
3 6,25 7,81 11,34
4 7,78 9,49 13,28
5 9,24 11,07 15,09
6 10,64 12,59 16,81
7 12,02 14,07 18,48
8 13,36 15,51 20,09
9 14,68 16,92 21,67
10 15,99 18,31 23,21
20 28,41 31,41 37,57
30 40,26 43,77 50,89
40 51,81 55,76 63,69

Tabela

161
Estatistica e Bioestatstica
2014

Anexo VIII - Valores Crticos para a anlise de varincia por nmero de ordem de
Friedman

k N 0.10 0.05 0.01


3 3 6.00 6.00
4 6.00 6.50 8.00
5 5.20 6.40 8.40
6 5.33 7.00 9.00
7 5.43 7.14 8.86
8 5.25 6.25 9.00
9 5.56 6.22 8.67
10 5.00 6.20 9.60
11 4.91 6.54 8.91
12 5.17 6.17 8.67
13 4.77 6.00 9.39

4.61 5.99 9.21


4 2 6.00 6.00
3 6.60 7.40 8.60
4 6.30 4.80 9.60
5 6.36 7.80 9.96
6 6.40 7.60 10.00
7 6.26 7.80 10.37
8 6.30 7.50 10.35

6.25 7.82 11.34


5 3 7.47 8.53 10.13
4 7.60 8.80 11.00
5 7.68 8.96 11.52

7.78 9.49 13.28


* Adaptado de Siegel, S. e Castellan Jr., N. J. Nonparametric statistics for the Behavioral Sciences, Mc Graw-
Hill, 1988

162
Este livro foi distribudo cortesia de:

Para ter acesso prprio a leituras e ebooks ilimitados GRTIS hoje, visite:
http://portugues.Free-eBooks.net

Compartilhe este livro com todos e cada um dos seus amigos automaticamente,
selecionando uma das opes abaixo:

Para mostrar o seu apreo ao autor e ajudar os outros a ter


experincias de leitura agradvel e encontrar informaes valiosas,
ns apreciaramos se voc
"postar um comentrio para este livro aqui" .

Informaes sobre direitos autorais

Free-eBooks.net respeita a propriedade intelectual de outros. Quando os proprietrios dos direitos de um livro enviam seu trabalho para Free-eBooks.net, esto nos dando permisso para distribuir
esse material. Salvo disposio em contrrio deste livro, essa permisso no passada para outras pessoas. Portanto, redistribuir este livro sem a permisso do detentor dos direitos pode constituir uma
violao das leis de direitos autorais. Se voc acredita que seu trabalho foi usado de uma forma que constitui uma violao dos direitos de autor, por favor, siga as nossas Recomendaes e Procedimento
de reclamaes de Violao de Direitos Autorais como visto em nossos Termos de Servio aqui:

http://portugues.free-ebooks.net/tos.html

You might also like