You are on page 1of 39

amostras

1
2009


amostras
Teoria e exercicios passo-a-passo

Amostra e tipos de amostragens

Margarida Pocinho
28-10-2009

amostras

2
2009
ndice Geral


NDICE DE TABELAS .................................................................................................................................................. 3
NDICE DE FIGURAS ................................................................................................................................................... 3
NDICE DE FRMULAS ............................................................................................................................................... 3
INTRODUO ............................................................................................................................................................ 4
1. NOES GERAIS .................................................................................................................................................... 4
Noes de estatistica ...........................................................................................................................................4
1.2 Noes de bioestatistica ................................................................................................................................6
1.2.1 - Definio ..............................................................................................................................................6
2. POPULAO E AMOSTRA ....................................................................................................................................... 9
2.1 Noes gerais ................................................................................................................................................9
2.1.1 Clculo do tamanho mnimo da amostra .............................................................................................. 11
3. TIPOS E MTODOS DE AMOSTRAGEM ................................................................................................................... 14
3.1 Amostragens Probabilsticas e No-Probabilsticas ................................................................................... 14
3.1.1 As Amostragens Probabilsticas ........................................................................................................... 15
3.1.2 As Amostragens No Probabilsticas: .................................................................................................. 25
3.2 Propriedades da distribuio normal .......................................................................................................... 26
4. DETERMINAO DO TAMANHO DA AMOSTRA ...................................................................................................... 31
4.1 Clculo do Tamanho da Amostra para Populaes Infinitas ..................................................................... 31
4.1.1.Proporo .............................................................................................................................................. 31
4.1.2. Determinao da Margem de Erro da Amostra ................................................................................... 35
4.2. Clculo do Tamanho da Amostra para Populaes finitas ........................................................................ 36
4.2.1. Proporo ............................................................................................................................................. 36
4.2.2. Mdia ................................................................................................................................................... 37



amostras

3
2009

ndice de Tabelas
TABELA 1 EXEMPLO 1 DE NMEROS ALEATRI OS .................................................................................................... 16
TABELA 2: DI STRI BUI O NORMAL E RESPECTI VOS DESVI OS ................................................................................... 27
TABELA 3: CURVA NORMAL - TABELA Z (REDUZI DA) .............................................................................................. 29
TABELA 4:DI STRI BUI O NORMAL PADRO ........................................................................................................... 32

ndice de Figuras
FI GURA 1:FLUXO DA IMPORTANCI A E CONTRI BUTO DA ESTATI STI CA. ........................................................................ 6
FI GURA 2:POPULAO E AMOSTRA ............................................................................................................................ 9
FI GURA 3:POPULAO E AMOSTRA .......................................................................................................................... 15
FI GURA 4: AMOSTRA ESTRATI FI CADA ...................................................................................................................... 20
FI GURA 5: AMOSTRA ESTRATI FI CADA PROPORCI ONAL ............................................................................................. 21
FI GURA 6: AMOSTRA ESTRATI FI CADA NO PROPORCI ONAL ...................................................................................... 21

ndice de Frmulas
FRMULA PARA POPULAES INFINITAS E VARIVEL INTERVALAR ........................................................................... 13
FRMULA PARA POPULAES FINITAS E VARIVEL INTERVALAR .............................................................................. 13
FRMULA PARA POPULAES INFINITAS E VARIVEL QUALITATIVA ........................................................................ 13
FRMULA PARA POPULAES FINITAS E VARIVEL QUALITATIVA ............................................................................ 14
FIGURA 3:POPULAO E AMOSTRA .......................................................................................................................... 15
FRMULA PARA PADRONIZAR TABELAS COM DISTRIBUIO GAUSSIANA ................................................................... 27
FRMULA PARA POPULAES INFINITAS E VARIVEL DICOTMICA .......................................................................... 32
FRMULA PARA POPULAES INFINITAS QUANDO NO TEMOS NENHUMA ESTIMATIVA DE P ..................................... 34
FRMULA PARACONHECER A MARGEM DE ERRO PADRO ......................................................................................... 35
FRMULA PARA POPULAES FINITAS ..................................................................................................................... 36


amostras

4
2009

Introduo

Desde sculos o homem tem, muitas vezes, tomado notas de coisas e de pessoas, no com o nico fim de
acumular nmeros, mas com a esperana de utilizar os dados do passado para a resoluo de problemas do
presente assim como para a previso de acontecimentos futuros. No entanto, o sucesso quanto a este objectivo
s foi possvel em data muito recente: s no final do sculo XIX e, sobretudo, no princpio do sculo XX que,
com a aplicao de probabilidades aos problemas sobre a interpretao dos dados recolhidos, foi possvel
resolver alguns deles.
A Estatstica conquistou, hoje, o seu lugar entre as cincias. O poder do seu mtodo , sobretudo, afirmado nas
ltimas dcadas e aplica-se, agora, nos domnios mais variados. At aqui, s um pequeno nmero de pessoas se
preocupou com estudos estatsticos, quer pela natureza das suas investigaes, quer por causa da sua utilidade
para as diferentes profisses. O valor e a importncia do mtodo estatstico residem no esforo para melhor
compreender o nosso mundo, to maravilhosamente complexo, tanto no ponto de vista fsico como social,
levam-nos a sonhar que ele se torne objecto de um conhecimento como as outras cincias. A vida corrente leva-
nos a decises para passar do conhecido ao desconhecido, da experincia previso.
Este manual tem por fim fornecer conhecimentos estatsticos (sem ter muitos conhecimentos matemticos) e
ajudar a interpretar os resultados que podem ser obtidos quer atravs do calculo manual, quer atravs de
programas de computador.
1. Noes Gerais

Noes de estatistica

Para algumas pessoas, a Estatstica no seno um quadro de colunas mais ou menos longas de nmeros que
dizem respeito populao, indstria ou ao comrcio, como se v frequentemente em revistas; para outras,
ela d grficos mostrando a variao no tempo de um facto econmico ou social, a produo ou os nmeros
relativos aos negcios de uma empresa, assim como se encontra nos escritrios de empresas privadas.
To diferenciados se apresentam os mtodos estatsticos que no possvel estabelecer uma definio que os
contenha a todos. Apesar disso, apresentamos a seguir uma definio que, embora necessariamente incompleta
como qualquer outra, tem a vantagem de introduzir o aluno na matria.
A Estatstica tem como finalidade elaborar de uma sntese numrica que evidencie o que de mais generalizado e
significativo exista num conjunto numeroso de observaes. O grande nmero de observaes de que se parte
reflecte uma diversidade tal que se torna ininteligvel a sua interpretao. Para que, a partir dessa diversidade
se possa comear a entender logo, torna-se necessrio reduzir sucessivamente as observaes, ganhando-se em
generalidade o que se vai perdendo em individualidade.
A sntese implica, assim, que nos desprendamos do que particular e individual para nos atermos ao que existe
de mais geral no conjunto das observaes; medida que a sntese progride, vai-se perdendo o contacto com as
particularidades imediatas.
Deste modo, a Estatstica no se ocupa do que excepcional, mas apenas do que geral: no se interessa pelo
indivduo, mas por grupos de indivduos; no se ocupa, em suma, de uma s medio, mas de um conjunto de
amostras

5
2009
medies. Acrescente-se, ainda, que a sntese numrica. Quer isto dizer que se prescinde inteiramente das
palavras e dos recursos literrios de mais ou menos efeito que elas possibilitam. Alcana-se a sntese pelo
recurso exclusivo dos nmeros.
Da o af com que frequentemente se escolhem os nmeros de acordo com os argumentos. A Estatstica
intrinsecamente uma disciplina no literria, manipula exclusivamente nmeros e alcana a sntese ordenando-
os e cooperando com eles.
Estatstica, deriva de status que em latim significa Estado, e que s por si demonstra a ligao que sempre
existiu entre ambos. O primeiro levantamento estatstico remonta a 3050 a.C., no Egipto, tendo como objectivo
informar o estado sobre recursos humanos e econmicos. No sc. XVII d.C., a disciplina de Estatstica era j
leccionada nas universidades alems, continuando com a finalidade de descrever as populaes e as riquezas
do Estado. Ainda no sc. XVII, d-se a expanso dos seus campos de investigao a reas como a Sade
pblica; a Indstria; o Comrcio e os Estudos Demogrficos.
Os mtodos de inferncia estatstica surgem com Jonh Graunt (1620-1674), um modesto comerciante, que tira
concluses vlidas sobre uma populao desconhecida por ele.
Fermat (1601-1665) e Pascal (1623-1662) permitem que o estudo do acaso tome uma expresso matemtica,
introduzindo o Clculo das Probabilidades. Esta expresso matemtica e o aparecimento do mtodo dos
mnimos quadrados, vm credibilizar a Estatstica conferindo-lhe a fundamentao matemtica em que ela,
hoje, assenta.
No sc. XVIII Lambert Quetelet (1796-1874) introduziu a Estatstica nas anlises da Meteorologia; da
Antropometria; das Cincias Sociais; da Economia e da Biologia.
Aos contributos anteriores Francis Galton (1822-1911), acrescenta as noes de regresso e correlao; Karl
Pearson (1857-1936) apresenta a mais bela e acabada teoria de Estatstica, ficando tambm conhecido pelos
seus coeficientes (r; c); Fisher com os seus trabalhos sobre inferncia Estatstica tambm deu um grande
contributo ao desenvolvimento da Estatstica.
Em 1943, d-se uma grande reviravolta, uma vez que o tratamento de dados deixa de ser feito manualmente e
passa, numa primeira fase, a ser apoiado por calculadoras potentes para mais tarde ser computadorizado.
O Mtodo Estatstico, segundo a teoria de Cramer, pressupe as seguintes fases:
Recolha de dados estatsticos: obteno da amostra a partir da populao, devendo depurar e
rectificar os dados estatsticos, que no seu conjunto so denominados srie estatstica.
Descrio: conjunto de operaes, numricas ou grficas, efectuadas sobre os dados estatsticos
determinando a sua distribuio; procede-se sua ordenao, codificao e representao por meio
de quadros e tabelas.
Anlise: consiste em tirar concluses sobre a distribuio da populao, determinar o seu grau de
confiana e ainda formular hipteses, tentando verific-las, quanto ao fenmeno em estudo.
Predio: uma previso do comportamento do fenmeno em estudo, tendo em conta a definio da
distribuio estatstica.
Em termos gerais, parece-nos que uma boa definio do que a estatstica, j que resume os conceitos dos
vrios autores, :
Cincia que trata do planeamento, colheita, organizao, sintetizao, apresentao e anlise de
dados, bem como, a obteno de concluses vlidas e tomada de decises em diversos campos do
saber (engenharias, sade, biologia, farmcia, biofsica, ciencias sociais, geografia, etc.).
Com efeito, o papel da Estatstica na pesquisa cientfica apoiar o investigador na formulao das hipteses
estatsticas e fixao das regras de deciso, no fornecimento de tcnicas para um eficiente plano de
amostras

6
2009
investigao, na colheita, tabulao e anlise dos dados (estatstica descritiva) e em fornecer testes de
hipteses a serem realizados de tal modo que a incerteza da inferncia possa ser expressa em um nvel
probabilstico pr-fixado (inferncia estatstica) cujo valor mximo de erro mais consensual de 5%. (fig 1)

FI GURA 1:FLUXO DA IMPORTANCI A E CONTRI BUTO DA ESTATI STI CA.

1.2 Noes de bioestatistica

1.2.1 - Definio

Historicamente foram muitas as definies estabelecidas para Estatstica. Da mesma forma, so muitas as
definies para Bioestatstica. Preferimos adotar a seguinte: Conjunto de tcnicas que permite recolher, apurar
e apresentar dados para que sejam analisados, proporcionando inferncias indutivas sobre as cincias da vida.
A m utilizao de dados mdicos ou de outras cincias, com interpretaes errneas ou mal intencionadas, tem
produzido um grande ceticismo em relao estatstica. Podemos encontrar muitos professores, clnicos ou
mesmo profissionais de cincias bsicas, que acham que bom senso" suficiente para tratar desses dados, que
qualquer coisa que exija prova estatstica no pode ter valor prtico ou que procuraro um matemtico se
tiverem algum problema estatstico em seu trabalho.
importante compreender, no entanto, que cada vz que se toma a mdia de duas leituras de exame, por
exemplo, ou o nmero mdio de dias de internamento no hospital de pacientes com determinada doena, se est
a usar um mtodo estatstico. Do mesmo modo, usamos mtodos estatsticos para concluir que a presso
arterial do paciente est normal ou que um tratamento cirrgico melhor que outro. Deste modo, a Estatstica
nas cincias da sade constitui-se realmente nos princpios da Medicina Quantitativa. Muito das cincias da
sade depende, directa ou indirectamente, de contagem ou mensurao. Isto bvio em pesquisa e verdadeiro
tambm no diagnstico. Quando um profissional superior de sade, leva em considerao na avaliao de um
tumor a sua idade e histria familiar, est a utilizar dados quantitativos, ou seja, a incidncia de tumores por
idade e por famlia.
Convencionou-ser chamar de Bioestatstica o conjunto de conceitos e mtodos cientficos usados no tratamento
da variabilidade nas cincias da sade em especial as cincias mdicas e biolgicas. A Bioestatstica fornece
mtodos para se tomar decises timas na presena de incerteza, estabelecendo faixas de confiana para a
eficcia dos tratamentos e verificando a influncia de factores de risco no aparecimento de doenas. Dentro da
rea biolgica, compreende-se por Biometria a cincia que estuda as medidas de seres vivos.
A nfase crescente do papel dos mtodos quantitativos na prtica da medicina torna imperativo que o estudante
de medicina assim como o profissional de sade tenham algum conhecimento de estatstica.
O estudante aprende na escola o melhor mtodo de diagnostico e teraputica; depois de formado depender
necessariamente de trabalhos apresentados em reunies, jornais e revistas cientificas, para aprender novos
mtodos de terapia, assim como os progressos em diagnostico e tcnicas. Portanto, dever :
amostras

7
2009
estar apto a avaliar por si prprio os resultados de outros pesquisadores, dever decidir quando uma
nova tcnica ou mtodo pode substituir os antigos.
estar apto a dar famlia do paciente, ou ao prprio, bem como aos seus colegas de trabalho,
segurana quanto ao diagnstico, o que pode depender de sua capacidade de avaliar adequadamente
os resultados de exames laboratoriais e outros, como tambm de seu conhecimento sobre a relao
entre a idade, sexo e outras condies do paciente e uma determinada doena. Os novos
conhecimentos viro atravs do trabalho de pesquisa realizado por ele prprio ou por outros.
ser capaz de seleccionar, da massa de informaes, aquelas que forem vlidas e que resistirem a testes
cientficos rgidos.
desenvolver um ceticismo sadio em relao a tudo que l. Uma noo bsica o reconhecimento de
que os indivduos diferem no apenas uns dos outros, mas tambm em relao a si prprios, de dia
para dia ou mesmo de hora para hora. Uma certa quantidade de variao normal, mas a questo que
desafia o profissional de sade determinar quando uma variao especfica se torna patolgica
(referente doena).
Para isso, o estudante deve aprender como medir a variao em indivduos normais e definir qual o limite de
variao normal. Deve aprender que h algum erro aleatrio presente em cada medida ou contagem feita.
altamente improvvel que duas contagens sucessivas de glbulos, feitas na mesma amostra de sangue, sejam
idnticas. Quando, porm, uma diferena se torna maior que o erro de mensurao? Para exercer as suas
funes do melhor modo possvel, o profissional de sade deve saber responder a questes como essa. Para
cada medida ou determinao fornecida pelo laboratrio, o profissional de sade deve conhecer a variao que
parte do prprio mtodo, para saber quando uma dada variao representa uma mudana real no paciente.
Sempre que novos mtodos de terapia so introduzidos, necessrio saber se so realmente superiores, isto ,
mais eficientes que os velhos mtodos. Ser nacessrio fazer-se a avaliao crtica do estudo experimental,
verificando principalmente se as medidas foram realizadas de modo a produzir resultados fidedignos, se o
factor em prova foi o nico factor de diferena entre o grupo experimental e o grupo controle, se a diferena
entre os resultados obtidos nos dois grupos foi maior que aquela que poderia ser atribuda ao acaso. Apenas
depois da avaliao, atravs de tcnicas estatsticas adequadas, da fidedignidade dos resultados,
comparabilidade dos grupos experincia e controle e, significncia da diferena encontrada que podemos
tirar as concluses relativas ao novo mtodo.
O nmero de falhas encontradas em publicaes mdicas enfatiza a necessidade de uma avaliao crtica da
literatura. Para ajudar o estudante a desenvolver tal atitude so necessrios certos conceitos estatsticos
bsicos e uma certa familiaridade com a terminologia mais usada. Os Mtodos estatsticos so essenciais no
estudo de situaes em que as variveis de interesse esto sujeitas, inerentemente, a flutuaes aleatrias. Este
o caso da rea da sade principalmente na Medicina. Mesmo tomando-se um grupo de pacientes homogneos,
observa-se grande variabilidade, por exemplo, no tempo de sobrevida aps um tratamento adequado. Dosagens
de caractersticas hematolgicas flutuam no s entre indivduos, como tambm no mesmo indivduo em
ocasies diferentes. Na realidade, h variaes entre diferentes pacientes para qualquer varivel de interesse
clnico. Portanto, para se estudar problemas clnicos, necessria uma metodologia capaz de tratar a
variabilidade de forma adequada.
Deve-se notar, entretanto, que ao tratar um paciente, o profissional de sade se vale da experincia de eventos
anteriores, vivenciada pessoalmente ou transmitida por outros atravs de livros e artigos. Assim, a Estatstica
pode ser vista como ferramenta de organizao e validao do conhecimento na rea da sade.
inegvel, hoje, que a cincia busca a verdade descrevendo o universo e estabelecendo princpios gerais para
explicar os fenmenos do universo. Para tanto deve valer-se do pensamento cientfico, que se estabelece ao
nvel de uma linguagem terica de conceitos e hipteses. As hipteses precisam ser comprovadas, quando se faz
necessria a utilizao de instrumentos operacionais que explicitaro os procedimentos usados para
observao e mensurao do fenmeno. So as hipteses estatsticas.
amostras

8
2009
A passagem da hiptese terica para a hiptese estatstica poderia ser assim exemplificada: Determinado
investigador estudar a veracidade da hiptese: "Os indivduos gordos comem mais que os indivduos magros".
Esta hiptese encerra alguns conceitos, como: gordo, magro e comer mais. Qualquer que seja o entendimento
destes conceitos tericos, para se operacionalizar a comprovao desta hiptese o investigador dever
estabelecer a maneira de medir gordo, magro e comer mais. Ou seja, como observar e medir gordo, magro e
comer mais? Uma traduo operacional destes conceitos pode ser de que gordo o indivduo que apresente
peso acima da faixa de normalidade no ndice de massa corporal (IMC), e magro o indivduo que apresente
peso abaixo dessa faixa. Comer mais seria traduzido como consumir mais calorias do que o definido como
necessrio pela tabela de ingesto diria de calorias de acordo com o perfil de atividades do indivduo.
Desta forma, a hiptese cientfica poderia ser enunciada como uma hiptese estatstica da seguinte forma: "Os
indivduos que apresentam peso acima da faixa de normalidade do IMC, ingerem mais calorias (medidas pela
tabela de ingesto diria), do que os indivduos que apresentam peso abaixo da faixa de normalidade do IMC".
Se esta hiptese referir-se a poucos indivduos basta verificar se verdade para estes indivduos e a questo
estar resolvida. No entanto, para a cincia no ter muita utilidade tal observao.
Em cincia buscam-se hipteses mais gerais, referentes a parmetros populacionais. Para tanto, sero
elaborados planos de coleta e anlise de dados que testaro a hiptese. Os dados sero colhidos e analisados
atravs de tcnicas estatsticas adequadas e, atravs de uma inferncia indutiva, aceita-se a veracidade ou
falsidade da hiptese estatstica e, conseqentemente, de sua hiptese cientfica correspondente.
Esquematicamente:
Observa-se determinado fenmeno e elabora-se uma hiptese cientfica que procura estabelecer a
relao entre seres e atributos;
A partir da hiptese cientfica se deduz (inferncia dedutiva) uma hiptese estatstica que permita
explicar o fenmeno observado dentro de uma estrutura universal e coerente, incorporada ao conjunto
de conhecimentos actuais;
Com a hiptese estatstica se deduzem (inferncia dedutiva) as conseqncias lgicas quanto ao que
deve ser esperado empiricamente com relao populao;
So estabelecidas as regras de deciso para aceitao ou no aceitao da hiptese;
A hiptese ser verificada quanto a sua veracidade ou falsidade atravs do estudo do comportamento
do fenmeno, com colheita de dados e anlise dos resultados atravs de tcnicas estatsticas
adequadas definidas previamente;
De acordo com o definido como regra de deciso, induz-se (inferncia indutiva), a partir dos
resultados e com base na teoria das probabilidades, a veracidade ou falsidade da hiptese estatstica e
a veracidade cientfica correspondente.
A inferncia indutiva ter tanto mais significado quanto mais rigoroso for o delineamento da colheita de dados
e quanto mais apropriada for a anlise estatstica destes dados. As falhas nestas fases podem implicar em que
os valores encontrados no reflitam adequadamente os parmetros correspondentes. A inferncia da hiptese
estatstica para a cientfica ser tanto melhor quanto mais adequada tenha sido a formulao dos conceitos
tericos.
Uma concluso indutiva bem confirmada provisoriamente aceita como verdade, tornando-se um princpio.
Ser ajustada com a aquisio de novos conhecimentos, somando experincias que a regulem, e permitindo o
contnuo ajuste do modelo realidade do universo.
Ao verificar a provvel verdade de uma hiptese, a Estatstica fornece, em bases probabilsticas, o risco de
errar ao aceitar ou rejeitar uma hiptese. Constitui-se em um instrumento dos mais poderosos para o
pesquisador na busca da verdade, e o principal instrumento para generalizar concluses a partir de
experimentos particulares.
amostras

9
2009
2. Populao e Amostra

2.1 Noes gerais

Populao: somatrio dos indivduos ou elementos, com qualquer caracterstica comum e que esto sujeitos a
uma anlise estatstica, por terem interesse para o estudo. Quanto sua origem pode ser: um conjunto de
pessoas; um conjunto de objectos ou um conjunto de acontecimentos. Quanto sua natureza pode ser:
Existente ou real; Hipottica ou parcialmente existente. Pode ainda ser: um conjunto finito ou um conjunto
infinito.
Amostra: um subconjunto retirado da populao, que se supe ser representativo de todas as caractersticas
da mesma, sobre o qual ser feito o estudo, com o objectivo de serem tiradas concluses vlidas sobre a
populao.
Amostragem: o procedimento pelo qual um grupo de pessoas ou um subconjunto de uma populao
escolhido com vista a obter informaes relacionadas com um fenmeno, e de tal forma que a populao inteira
nos interessa esteja representada (fig. 2)

FI GURA 2:POPULAO E AMOSTRA
Parmetro: uma caracterstica numrica da populao, como uma mdia da populao, um desvio padro da
populao, uma proporo da populao e assim por diante.
O Plano de Amostragem serve para descrever a estratgia a utilizar para seleccionar a amostra. Este plano
fornece os detalhes sobre a forma de proceder relativamente utilizao de um mtodo de amostragem para
determinado estudo.
Logo que o investigador delimite a populao potencial para o estudo, ele deve precisar os critrios de seleco
dos seus elementos, que podem ser de incluso ou de excluso dos sujeitos que faro parte do estudo:
Uma amostra dita representativa se as suas caractersticas se assemelham o mais possvel s da populao-
alvo. particularmente importante que a amostra represente no s as variveis em estudo, mas tambm outros
factores susceptveis de exercer alguma influncia sobre as variveis estudadas, como a idade, o sexo, a
escolaridade, o rendimento, etc.
A Representatividade avalia-se comparando as mdias da amostra com as da populao-alvo.
Sendo a Populao o conjunto de elementos (pessoas, coisas, objetos) que tm em comum uma caracterstica
em estudo, esta pode ser Finita - quando apresenta um nmero limitado de indivduos (Exemplo: a populao
constituda por todos os pace makers colocados num hospital, num determinado periodo ou o numero de
rastreios auditivos feitos num determinado dia numa unidade de rastreio).
amostras

10
2009
A populao pode ainda ser Infinita: quando o nmero de observaes for a partida indeterminve, como por
exemplo a populao constituda de todos os resultados (cara e coroa) em sucessivos lances de uma moeda).
Sendo a Amostra o conjunto de elementos retirados da populao, suficientemente representativos dessa
mesma populao, estaremos aptos para analisar os resultados como se estudssemos toda a populao. A
amostra sempre finita, pelo que quanto maior for, mais significativo o estudo. Contudo, como existe sempre
a incerteza de que todas as caractersticas da populao esto presentes numa amostra, j que estas so muitas
vezes desconhecidas, admite-se que existe sempre um grau de erro.
Como preliminar para uma discusso do papel que a teoria desempenha em uma pesquisa por amostragem,
interessante descrever sucintamente os estgios envolvidos no planeamento e execuo de uma pesquisa. As
pesquisas variam grandemente na sua complexidade. Extrair uma amostra de um conjunto de 5000 processos
numerados e ordenados num arquivo de uma instituio de ensino superior uma tarefa simples. Muito
diferente a extraco de uma amostra de seropositivos, face quer s vrias disposies ticas como o direito
confidencialidade do seu estado de sade, quer ao medo do preconceito e respectivas consequncias sociais e
profissionais, o que faz com que este tipo de grupos olhe com desconfiana qualquer estranho que comece a
fazer perguntas.
Podemos agrupar as principais fases de uma pesquisa, de forma um tanto arbitrria, nos seguintes 11 tpicos.
Objectivos da pesquisa: devem estar claramente definidos para que todas as decises estejam de acordo com
os mesmos
Populao: a populao a ser submetida a amostragem deve coincidir com a populao sobre quem
desejamos informao (populao alvo).
Dados a serem recolhidos: convm verificar se todos os dados que se pretendem so relevantes para a
finalidade da pesquisa e que nenhum dado essencial seja omisso. H uma tendncia frequente,
sobretudo com populaes humanas, de formular um nmero demasiadamente grande de questes,
algumas das quais no chegam sequer a ser analisadas subsequentemente. Um questionrio muito
extenso reduz a qualidade das respostas, tanto a questes importantes como a questes secundrias.
Grau de preciso desejado: os resultados de pesquisas por amostragem esto sempre sujeitos a certo grau de
incerteza, no s porque se estudou apenas uma parte da populao, mas tambm em decorrncia de
erros de mensurao. Esta incerteza pode ser reduzida aumentando-se o tamanho da amostra e
utilizando-se instrumentos mais precisos de mensurao. O estatstico pode prestar bom auxlio nesta
fase.
Mtodo de mensurao: parte importante do trabalho preliminar a construo de formulrios onde se
registaro as perguntas e as respostas. No caso de questionrios simples, as respostas podem s vezes
ser pr-codificadas - isto , registadas de maneira que possam ser transferidas sem dificuldade para
uma base de dados. De facto, para construir bases de dados adequadas, necessrio pr-visualizar a
estrutura das tabelas finais que sero usadas para tirar as concluses pretendidas.
Sistemas de referncia: a construo de uma lista de unidades de amostragem, chamada Sistema de
Referncia, , em geral, um dos principais problemas prticos. Com efeito, antes de seleccionar a
amostra, a populao deve ser dividida em partes, chamadas unidades de amostragem, sendo que estas
devem abranger toda a populao, sem qualquer sobreposio. Isto : cada elemento da populao
deve pertencer a uma, e somente uma, unidade.
Escolha da amostra: h uma variedade de planos para a escolha da amostra. Para cada plano considerado,
podem-se fazer estimativas do tamanho da amostra com base no conhecimento do grau de preciso
desejado. Devem-se comparar os custos relativos e o tempo envolvidos em cada plano antes de se
tomar uma deciso.
O pr-teste: deve-se testar sempre o questionrio enquanto o mtodo de recolha de dados, numa amostra
semelhante que vamos utilizar mas em tamanho reduzido. Isto quase sempre resulta em melhoria do
instrumento e pode revelar outros problemas que seriam srios de ultrapassar de outra forma.
Organizao do trabalho de campo: todas as tarefas devem estra previamente definidas em cronograma e em
fases, antecipando desde logo os problemas, muitas vezes de carcter administrativo. de grande
amostras

11
2009
valia um processo para verificao preliminar da qualidade dos resultados, que devem, desde logo
prever, a ausncia de resposta, isto , a falha do entrevistador em obter informaes de determinadas
unidades da amostra.
Resumo e anlise dos dados: o primeiro passo a depurao dos dados (ver se existe omisso de respostas,
eliminar dados errneos, m insero de respostas, inconsistncias, etc.). S aps a depurao se
precedem aos clculos que conduzem s estimativas.
Informao e aprendizagem para futuras pesquisas: quanto mais informaes tivermos inicialmente sobre
uma populao, mais fcil se torna planear uma amostra que d estimativas precisas. Qualquer
amostragem completada , em potncia, um guia para futuras amostragens, melhoradas nos vrios
dados que ela fornece (mdias, desvios padro, natureza da variabilidade das mensuraes principais,
o custo da obteno dos dados, etc.). A prtica da amostragem avana mais rapidamente quando se
renem e registam informaes deste tipo. Relativamente aprendizagem, um facto que um
pesquisador arguto aprende a reconhecer erros de execuo e fazer com que eles no ocorram em
pesquisas futuras.
Erro de Amostragem: a diferena que existe entre os resultados obtidos numa amostra e os que teriam sido
obtidos na populao-alvo. Para reduzir ao mnimo o erro amostral deve-se recorrer a duas
estratgias:
1. Retirar de forma aleatria e um nmero suficiente de sujeitos que faro parte da amostra.
2. Procurar reproduzir o mais fielmente possvel a populao pela tomada em conta das caractersticas
conhecidas desta.

2.1.1 Clculo do tamanho mnimo da amostra

Apesar da existncia de vrias frmulas, a amostra varia muito de pesquisa para pesquisa. Porm, deve se levar
em conta o tamanho da populao. Todavia, algumas observaes podem ser levadas em consideraes, a
saber:
Tamanho da diferena considerada importante
Quanto menor a diferena maior a amostra
Quanto maior o nmero de elementos numa amostra, menor os desvios dos parmetros em relao ao
valor esperado da populao. Quanto maior a homogeneidade da populao, menor a amostra a ser
pesquisada.
Poder desejado para o teste
Probabilidade de que a amostra identifique uma diferena real
Tempo, verbas e pessoal disponveis, dificuldade na obteno dos dados e complexidade do
experimento
Os pesquisadores de todo o mundo, na realizao de pesquisas cientficas, em qualquer sector da actividade
humana, utilizam as tcnicas de amostragem no planeamento de seus trabalhos, no s pela impraticabilidade
de poderem observar, numericamente, na sua totalidade determinada populao em estudo, como devido ao
aspecto econmico dessas investigaes, conduzidos com um menor custo operacional, dentro de um menor
tempo, alm de possibilitar maior preciso nos respectivos resultados, ao contrrio, do que ocorre com os
trabalhos realizados pelo processo censitrio (COCHRAN, 1965; CRUZ, 1978).
A tcnica da amostragem, a despeito de sua larga utilizao, ainda necessita de alguma didtica mais adequada
aos pesquisadores principiantes. Na teoria da amostragem, so consideradas duas dimenses:
1) Dimensionamento da Amostra;
2) Composio da Amostra.
amostras

12
2009

2.1.1.1 Procedimentos para determinar o tamanho da amostra
So vrios os procedimentos para determinar o tamnho de uma amostra, contudo deve ter-se em ateno a
seguinte sequencia:
Analisar o questionrio, ou roteiro da entrevista e escolher uma varivel que julgue mais importante
para o estudo. Se possvel mais do que uma;
Verificar o nvel de mensurao da varivel: nominal, ordinal ou intervalar;
Considerar o tamanho da populao: infinita ou finita
O tamanho da amostra determina-se em funo do nvel de mensurao da varivel escolhida.
So vrias as formulas que permitem calcular o tamanho de uma amostra. A escolha depende do fenmeno em
estudo ou dos paramentros disponveis:


Para os clculos que se seguem escolhemos apenas alguns tipos de formulas com base na simplicidade da sua
notao.

amostras

13
2009
2.1.1.1.1 - Varivel intervalar e populao infinita
Sempre que a varivel mais importante do seu estudo for de nvel intervalar (varivel quantitativa) use a
frmula:
Frmula para populaes infinitas e varivel intervalar
onde: Z = abscissa da curva normal padro, fixado um nvel de confiana (1-o)
Z = 1,65 (1 - o) = 90%
Z = 1,96 (1 - o) = 95%
Z = 2,0 (1 - o) = 95.5%
Z = 2,57 (1 - o) = 99%
o = desvio padro da populao, expresso na unidade varivel, onde poder ser determinado por:
especificaes tcnicas
com base em valores de estudos semelhantes
conjecturas sobre possveis valores
d = erro amostral, expresso na unidade da varivel. O erro amostral a mxima
diferena que o investigador admite suportar entre e x , isto : x < d .

2.1.1.1.2 - Varivel intervalar e populao finita
Quando a varivel de nvel intervalar e a populao considerada finita, determina-se o tamanho da amostra
pela frmula:
Frmula para populaes finitas e varivel intervalar
onde:
Z = abscissa da normal padro
o
2
= varincia populacional
N = tamanho da populao
d = erro amostral

2.1.1.1.3 - Varivel qualitativa (nominal ou ordinal) e populao infinita

No caso da varivel de referencia ser nominal ou ordinal, e a populao for considerada infinita, a frmula
pode ser:
Frmula para populaes infinitas e varivel qualitativa
onde: Z = abscissa da normal padro
= estimativa da verdadeira proporo de um dos nveis da varivel escolhida.
amostras

14
2009
Por exemplo, se a varivel escolhida for uma patologia tratada num servio de um hospital, poder ser a
estimativa da verdadeira proporo dessa mesma patologia tratadas em todos os hospitais, nesse mesmo
servio (ficando excludos os hospitais que no tm esse servio).
ser expresso em decimais ( = 30% = 0.30).
= 1
d = erro amostral, expresso em decimais. O erro amostral neste caso ser a
mxima diferena que o investigador admite suportar entre t e , isto :
< , em que t a verdadeira proporo (frequncia relativa do evento a ser calculado a partir da
amostra.

2.1.1.1.4 - Varivel qualitativa (nominal ou ordinal) e populao finita
Se a varivel for nominal ou ordinal, mas a populao for considerada finita, determina-se o tamanho da
amostra pela frmula:
Frmula para populaes finitas e varivel qualitativa
onde:
Z = abscissa da normal padro
N = tamanho da populao
= estimativa da proporo.
= 1
d = erro amostral
Estas frmulas so bsicas para qualquer tipo de composio da amostra; todavia, existem frmulas especficas
segundo o critrio de composio da amostra.
- Se o investigador escolher mais de uma varivel, poder acontecer de ter que aplicar mais de uma frmula,
assim dever optar pelo maior valor de "n".
Obs.: Quando no tivermos condies de prever o possvel valor para , admita = 0,50 pois, dessa forma,
voc ter o maior tamanho da amostra, admitindo-se constantes os demais elementos.

3. tipos e Mtodos de Amostragem

3.1 Amostragens Probabilsticas e No-Probabilsticas

A amostragem probabilstica quando cada elemento na populao tem a mesma probabilidade conhecida e
diferente de zero de pertencer amostra. usada alguma forma de sorteio. Permite generalizaes para a
totalidade da populao.
amostras

15
2009
O tipo de amostragem no probabilstica, pode prejudicar a possibilidade de generalizaes (validade externa)
de um estudo, fazendo com que no seja representativo em relao populao. Os seus resultados so vlidos
para aquele estudo determinado, no permitindo generalizaes para outras situaes semelhantes.
Exemplos:
por voluntrios: os elementos amostrais so voluntrios para a pesquisa. Bastante empregada em
experimentos com medicamentos e tcnicas mdicas.
intencional: o pesquisador escolhe os elementos amostrais. Entrevistar os ex-secretrios de sade para
pesquisa de polticas de sade.
por acesso mais fcil: os elementos so escolhidos por estarem mais prximos ou em melhores
condies de acesso. Ex: Aplicar questionrio na populao da zona rural mais prxima do centro.

3.1.1 As Amostragens Probabilsticas
Como j referimos os mtodos de amostragem probabilstica servem para assegurar uma certa preciso na
estimao dos parmetros da populao, reduzindo o erro amostral.
O objectivo desta abordagem obter a melhor representatividade possvel.


Figura 3:populao e amostra

3.1.1.1 Tcnicas de Amostragens Probabilsticas
As tcnicas de amostragem probababilisticas mais comuns entre ns so:
A Amostragem Aleatria Simples;
A Amostragem Sistemtica.
A Amostragem Aleatria Estratificada;
A Amostragem em Cachos;

3.1.1.1.1 - Amostragem Aleatria Simples
A Amostragem aleatria simples uma tcnica segundo a qual cada um dos elementos (sujeitos) que compe a
populao alvo tem igual probabilidade de ser escolhido para fazer parte de uma amostra. um procedimento
que pode se tornar trabalhoso quando a populao muito grande. aplicado quando a populao
amostras

16
2009
considerada homognea. Para manter essa propriedade deve-se numerar todos os elementos da populao e,
atravs de um sorteio ou do auxlio de uma tabela de nmeros aleatrios, obter os elementos que comporo a
amostra desejada. Por exemplo:
Obter uma amostra representativa, de 10%, de uma populao de 200 alunos de uma escola.
1) Numerar os alunos de 1 a 200;
2) Escrever os nmeros de 1 a 200 em pedaos de papel e coloc-los em uma urna;
3) Retirar 20 pedaos de papel, um a um, da urna, formando a amostra da populao.
Nesta tcnica de amostragem, todos os elementos da populao tm a mesma probabilidade de serem
selecionados: 1/N, onde N o nmero de elementos da populao.

Um outro exemplo recorrer a uma lista com nmeros aleatrios (LNA).
Tabela 1 exemplo 1 de nmeros aleatrios


Os nmeros aleatrios podem ser seleccionados de qualquer lugar da tabela, o importante seleccionar e
manter uma sequncia lgica (ex: coluna de cima para baixo, linha esquerda para a direita, etc). Existem
vrias tabelas de nmeros aleatrios com sequncia de trs, quatro ou cinco nmeros. Essas tabelas tambm
podem ser obtidas em programas como Excel.
Apesar de se pretender representatividade quando recorremos a uma tcnica de amostragem aleatria, pode
ocorrer que a amostra no seja representativa da populao.
Por exemplo, uma populao formada por 50% de mulheres e 50% de homens, a amostragem probabilstica
simples pode resultar numa amostra de 65% de mulheres e 35% de homens. Nesse caso a amostra continua a
ser aleatria, mas no representativa.
Uma amostra aleatria simples poder ser constituida segundo duas tcnicas:
amostra com reposio
amostra sem reposio
amostras

17
2009
Na amostragem com reposio, a unidade selecionada retorna para a populao. Portanto, em cada nova
seleco, a populao mantm a mesma quantidade de unidades elementares.
Na amostragem realizada sem reposio, a unidade seleccionada no retorna para a populao. Portanto, em
cada seleo a populao reduzida de uma unidade elementar.
importante observar que, em geral, as amostragens so realizadas sem reposio e os clculos estatsticos
nos dois tipos de amostragens so os mesmos.
Por exemplo, numa pesquisa de inteno de voto para escolha do presidente da republica, espera se que cada
pessoa seja entrevistada apenas uma vez. Se o tamanho da populao for suficientemente maior que o tamanho
da amostra, (pelo menos vinte vezes), os resultados estatsticos das amostras com e sem reposio no sero
muito diferentes, pois a probabilidade de escolher o mesmo elemento muito pequena. Contudo, deve-se ter
cuidado redobrado quando a populao pequena quando comparadas com o tamanho da amostra a ser
extrada.
3.1.1.1.1 - E1:
Imagine que queria identificar uma amostra aleatria simples de 12 centros de sade de um total de 372 de uma
determinada sub-regio, para passar um inqurito ou consultar um conjunto de processos clinicos. Os nomes
dos centros estavam disponveis na administrao regional dessa mesma regio. Como regra de aleatorizao
usou a oitava coluna de nmeros aleatrios de cinco dgitos da tabela 1, ignorou os dois primeiros dgitos
aleatrios em cada um dos grupos de nmeros aleatrios de cinco dgito., comeou com o nmero aleatrio 108
(resultado de um sorteio) e continuou de cima para baixo na coluna de nmeros aleatrios.
Qual foi o resultado da seleco
1
?


No caso da tcnica de amostragem em referencia, sendo N o nmero total de elementos da populao e n
o nmero total de elementos da amostra, a probabilidade de cada elemento pertencer amostra ser de n/N.
a mais simples de ser obtida mas, como j referimos, contudo, a sua aplicao restringe-se investigao de
caractersticas distribudas homogeneamente na populao.

3.1.1.1.2 - Amostragem Sistemtica
Tal como a tcnica de amostragem aleatria simples, s se pode utilizar quando existe uma lista ordenada de
elementos da populao, seja por ordem alfabtica, seja em arquivo, processo clinico ou numa lista telefnica.
Esta tcnica consiste em retirar K elementos dessa lista sendo o primeiro elemento da amostra retirado ao
acaso. O que a faz diferir da tcnica anterior o tamanho do intervalo, que aqui corresponde razo entre o
tamanho da populao e da amostra.
aplicada em populaes finitas; os elementos so escolhidos por um sistema, utilizando a sua ordenao
natural (listagens, registos, alunos, etc.). Define-se a quantidade k que a sigla que representa o intervalo de
amostragem (k=N/n); a seguir deve ser sorteado o incio do sistema, a partir do qual sero definidos os
elementos amostrais para cada k.

1 Resoluo: 108 290 201 292 322 009 244 249 226 125 147 113

amostras

18
2009
Face ao exposto podemos referir que uma amostra sistemtica de tamanho n constituda dos elementos de
ordem K, K + r, K + 2r, ...,
onde
K um inteiro escolhido aleatoriamente entre 1 e n

r o inteiro mais prximo da frao N/n.

j que esta tcnica de amostragem em populaes que possuem os elementos ordenados, em que no h a
necessidade de construir um sistema de referncia, a seleco dos elementos que comporo a amostra pode ser
feita por um sistema criado pelo pesquisador.
Exemplo 1
Obter uma amostra de 80 casas de uma rua que contm 2000 casas. Nesta tcnica de amostragem, podemos
realizar o seguinte procedimento:
1) Como 2000 dividido por 80 igual a 25, escolhemos, por um mtodo aleatrio (por exemplo sorteio)
qualquer, um nmero entre 1 e 25, que indica o primeiro elemento seleccionado para a amostra.
2) Consideramos os demais elementos, periodicamente, de 25 em 25.
Se o nmero sorteado entre 1 e 25 for o nmero 8, a amostra ser formada pelas casas: 8, 33, 58, 83, 108,
etc.
Apesar de esta tcnica ser de fcil execuo, h a possibilidade de haver ciclos de variao, que tornariam a
amostra no-representativa da populao.


Por exemplo, se a populao tem 100 elementos e vamos escolher uma amostra de tamanho 6, K um inteiro
escolhido aleatoriamente entre 1 e 6 e r = 100/6 = 16,6 = 17.
Se K = 3, a amostra ser composta pelos seguintes elementos: 3, 20, 37, 54, 71, 88.
Se o tamanho da populao desconhecido, no podemos determinar exatamente o valor de r. Escolheremos
intuitivamente um valor razovel para r.
s vezes a amostragem sistemtica preferida amostragem aleatria simples, porque mais fcil de executar,
estando portanto sujeita a erros, e proporciona mais informaes com menor custo.
Exemplo: tcnica adequada para extrair uma amostra de 50 internautas de um cibercaf
Soluo: A amostragem aleatria simples no pode ser empregada neste caso, pois o entrevistador no pode
determinar quais os utilizadores a serem includos na amostra, uma vez que no se conhece o tamanho
N da populao, at que todos os internautas tenham ido ao respectivo cibercaf.
A amostragem sistemtica a mais apropriadas pois podemos defenir um intervalo (digamos 1 em cada 20
internautas que aparecam para utilizar a internet) at obter a amostra do tamanho desejado.

n
N
K =
amostras

19
2009
3.1.1.1.2 E1:
Em 1500 alunos de uma escola foram sorteados 150 para compor a amostra de um estudo. Estando esses
alunos ordenados em listagens, ficou definido o seguinte intervalo de sorteio:
1500 150 = 10
Sorteou-se um nmero entre para dar incio composio da amostra cujo resultado foi 3
Quais foram as unidades amostrais
2
?


3.1.1.1.2 E2:
Defina k para uma amostra de 100 indivduos com a populao de 1000
3




3.1.1.1.3 - Amostragem Aleatria Estratificada
A amostragem estratificada utiliza-se quando a populao possui caractersticas que permitem a criao de
subconjuntos, j que nestes casos as amostras extradas por amostragem simples so menos representativa.
Com efeito, a amostragem aleatria estratificada mais uma variante da amostra aleatria simples, uma vez
que aps diviso da populao alvo em subgrupos homogneos chamados estratos, a seguir se tira de forma
aleatria uma amostra de cada estrato.
A Amostragem aleatria estratificada utilizada, ao contrrio das anteriores, quando a populao inteira
reconhecida por certas caractersticas precisas, tais como a idade, o sexo, a incidncia de uma condio de
sade, tudo isto para assegurar a melhor representatividade possvel. Com efeito, quando os elementos da
populao esto divididos em grupos no sobrepostos, mais fcil e mais eficiente escolher,
independentemente, uma amostra aleatria simples dentro de cada um destes grupos, os quais so chamados
estratos.
Esta forma de amostragem uma das mais utilizadas, j que a maioria das populaes tm estratos bem
definidos: os homens e as mulheres; os alunos das escolas X, Y, Z; os operrios pertencentes aos indices
salariais 190, 195, etc.
O mais comum utilizar-se a amostragem estratificada proporcional, que consiste em seleccionar os elementos
da amostra entre os vrios estratos, em nmero proporcional ao tamanho de cada um dos estratos.
Como a populao se divide em subconjuntos, convm que o sorteio dos elementos leve em considerao tais
divises, para que os elementos da amostra representem o nmero de elementos desses subconjuntos. Como
exemplo observe a figura abaixo:

2 3 + 13 + 23 + 33 + ... + 1493.

3 10
amostras

20
2009

FI GURA 4: AMOSTRA ESTRATI FI CADA

Em outras palavras, sejam:
N - o nmero de elementos da populao
L - o nmero de estratos
N
i
- o nmero de elementos do estrato i
n - o tamanho da amostra a ser seleccionada.

Note-se que: N = N1 + N2 + ... + NL
Nmero de elementos a serem sorteados em cada estrato ser: N
1
f, N
2
f, ..., N
k
f



Exemplo 1:
Numa populao de 200 estudantes, h 120 rapazes e 80 raparigas. Pretende-se extrair uma amostra
representativa, de 10%, dessa populao.
Neste exemplo, h uma caracterstica que permite identificar 2 subconjuntos, a caracterstica Sexo.
Considerando essa diviso, vamos considerar a populao e extrair a amostra da populao.

SEXO POPULAO AMOSTRA (10%)
Masculino 120 12
Feminino 80 8
Total 200 20

Portanto, a amostra deve conter 12 alunos do sexo masculino e 8 do sexo feminino, totalizando 20 alunos, que
correspondem a 10% da populao.
Para seleccionar os elementos da populao para formar a amostra, podemos executar os seguintes passos:
1) Numerar os estudantes de 1 a 200, sendo os alunos numerados de 1 a 120 e as alunas, de 121 a 200;
2) Escrever os nmeros de 1 a 120 em pedaos de papel e coloc-los em uma urna A;
amostras

21
2009
3) Escrever os nmeros de 121 a 200 em pedaos de papel e coloc-los em uma urna B;
4) Retirar 12 pedaos de papel, um a um, da urna A, e 8 da urna B, formando a amostra da populao.
O prximo exemplo, tambm, representa populaes com caractersticas heterogneas cujas concluses podem
ficar comprometidas se estas no forem consideradas na composio da amostra. Assim a populao
subdividida em grupos homogneos (estratos) e a amostra ser sorteada intragrupos. O tamanho de cada
estrato ser definido pela varincia da caracterstica a ser estudada ou seja proporcional (exemplo 1 e 2) ou
atravs da definio de uma percentagem dos estratos ou seja no proporcional (exemplo 3).
Exemplo 2:

FI GURA 5: AMOSTRA ESTRATI FI CADA PROPORCI ONAL

Exemplo 3:


FI GURA 6: AMOSTRA ESTRATI FI CADA NO PROPORCI ONAL

Perguntas frequentes:
1. Como calcular o valor/ percentagem apropriada para escolher dentro dos estratos?
a. A resposta simples. Utiliza-se uma formula adequada ao tamanho da populao, mas sobre
esse assunto dissertaremos mais adiante.
2. Como seleccionar os sujeitos dentro dos estratos?
a. Como estamos perante uma amostra aleatria, embora estratificada, recorre-se ao sorteio ou
a uma LNA
Populao-Alvo
2000 estudantes em Cincias
Sociais
Classificao
Estratificao Proporcional
40 Estudantes
Doutoramento
Estrato 2
Mestrado
600 = 30%
Estrato 3
Licenciatura
1000 = 50%
Escolha Aleatria
Estratificao No-Proporcional
Amostra = 200
Escolha Aleatria de 10% em cada Estrato
Estrato 1
Doutoramento
400 = 20%
60 Estudantes
Mestrado
100 Estudantes
Licenciatura
Populao-Alvo
2000 estudantes em Cincias
Sociais
Classificao
Estratificao Proporcional
40 Estudantes
Doutoramento
Estrato 2
Mestrado
600 = 30%
Estrato 3
Licenciatura
1000 = 50%
Escolha Aleatria
Estratificao No-Proporcional
Amostra = 200
Escolha Aleatria de 10% em cada Estrato
Estrato 1
Doutoramento
400 = 20%
60 Estudantes
Mestrado
100 Estudantes
Licenciatura
Populao-Alvo
2000 estudantes em Cincias
Sociais
Classificao
Estratificao Proporcional
40 Estudantes
Doutoramento
Estrato 2
Mestrado
600 = 30%
Estrato 3
Licenciatura
1000 = 50%
Escolha Aleatria
Estratificao No-Proporcional
Amostra = 200
Escolha Aleatria de 10% em cada Estrato
Estrato 1
Doutoramento
400 = 20%
60 Estudantes
Mestrado
100 Estudantes
Licenciatura
Populao-Alvo
2000 estudantes em Cincias
Sociais
Classificao
Estratificao Proporcional
40 Estudantes
Doutoramento
Estrato 2
Mestrado
600 = 30%
Estrato 3
Licenciatura
1000 = 50%
Escolha Aleatria
Estratificao No-Proporcional
Amostra = 200
Escolha Aleatria de 10% em cada Estrato
Estrato 1
Doutoramento
400 = 20%
60 Estudantes
Mestrado
100 Estudantes
Licenciatura
amostras

22
2009

3.1.1.1.3 E1:
De um conjunto de 30 utentes de um servio portadores de uma determinada patologia, pretendia-se
seleccionar 8 deles para um seguimento especifico (n) em funo do seu sub-grupo (estrato de gravidade da
patologia). Em termos de severidade, 6 utentes (N
1
) a forma moderada da patologia e 24 utentes (N
2
) tinha a
forma mais grave. Calcule-se uma amostra aleatria proporcional.
Sabendo que de cada estrato constitudo por N
1
e N
2
sero sorteadas n
1
e n
2
unidades, respectivamente.

Assim em primeiro calcula-se o tamanho da amostra (neste caso 8 utentes) e depois a fraco (f) da
amostragem, multiplicando f por N e por fim calculamos o numero de sujeitos que devem ser escolhidos dentro
de cada estrato multiplicando f pelo tamanho de cada estrato (N
1
f, N
2
f, ..., N
k
f) que neste exemplo 6 e 24
FRMULA PARA DETERMI NAR A FRAO (f) PARA CADA ESTRATO


Assim o resultado seria
f= 8/30 = 0,27

Feitos os calculos recorremos a um sorteio ou a uma LNA.
No caso em explanao escolhemos uma tabela de nmeros aleatrios e seleccionmos os 2 do estrato que
apresentam grau moderado e os 6 utentes do que apresentam grau severo da patologia em causa, seguindo a
regra :
Os primeiros 2 numeros no superiores a 6 (j que 6 o numero mximo possvel) e os primeiros 6 numeros
no superiores a 24 (j que este o numero mximo neste estrato).
De acordo com a regra para a seleco escolhida (comecar no 6. numero da 2. linha em ambos os casos e
quando chegar ao fim da tabela subir pelo lado esquerdo virando direita) quais os utentes seleccionados?

Os resultados foram:
01. Aristteles
02. Cardoso
03. Ernesto
04. Guilherme
05. Joana
06. Andreia
01. Anastcio
05. Carlos
09. Elisabete
13. David
17. Jorge
21. Luisa
02. Arnaldo
06. Cludio
10. Francisco
14. Raul
18. Joaquina
22. Maria Jos
03. Bartolomeu
07. Gabriel
11. Fernando
15. Sergio
19. Jos da Silva
23. M
a
Cristina
04. Joaquim
08. Marco
12. Andr
16. Nelo
20. Mauro
24. Bernardino
59 58 48 36 47 92 85 05 38 65 47 49 10 41 05 10 75 59 75 99 17 28 97 99 75
53 26 21 50 21 37 93 85 52 86 86 22 75 34 37 69 85 25 03 78 50 26 18 25 10
amostras

23
2009

Confira.
Veja a diferena entre quem era selecionado por este mtodo ou se tivssemos escolhido uma amostra aleatria
simples.
A tabela que se segue tem os utentes numerados de 1 a 30




(confira os seus resultados com as solues que apresentmos).
As diferenas so evidentes, apenas 1 com patologia moderada era seleccionado e dos restantes apenas a M
Jos coincidia. As regras so importantes e a tcnica de seleco faz toda a diferena.
Com efeito, entre as vantagens da amostragem estratificada destacam-se:
Os dados so geralmente mais homogneos dentro de cada estrato do que na populao como um todo;
O custo da recolha e anlise dos dados frequentemente menor do que na aleatria simples, devido a
convenincias administrativas;
Podem-se obter estimativas separadas dos parmetros populacionais para cada estrato sem seleccionar outra
amostra e, portanto, sem custo adicional.

01. Aristteles
02. Cardoso
03.Ernesto
04. Guilherme
05.J oana
06. Andreia
01. Anastcio
05. Carlos
09. Elisabete
13. David
17. Jorge
21. Luisa
02. Arnaldo
06. Cludio
10. Francisco
14. Raul
18. Joaquina
22. Maria Jos
03. Bartolomeu
07. Gabriel
11. Fernando
15. Sergio
19. Jos da Silva
23. M
a
Cristina
04. Joaquim
08. Marco
12. Andr
16. Nelo
20. Mauro
24. Bernardino
01. Aristteles
06. Cardoso
11. Ernesto
16. Guilherme
21. Joana
26. Andreia
31. Paula
02. Anastcio
07. Carlos
12. Elisabete
17. David
22. Jorge
27. Luisa
32. Paulo Csar
03. Arnaldo
08. Cludio
13. Francisco
18. Raul
23. Joaquina
28. Maria Jos
04. Bartolomeu
09. Gabriel
14. Fernando
19. Sergio
24. Jos da Silva
29. M
a
Cristina
05. Joaquim
10. Marco
15. Andr
20. Nelo
25. Mauro
30. Bernardino
59 58 48 36 47 92 85 05 38 65 47 49 10 41 05 10 75 59 75 99 17 28 97 99 75
53 26 21 50 21 37 93 85 52 86 86 22 75 34 37 69 85 25 03 78 50 26 18 25 10
01. Aristteles
06. Cardoso
11. Ernesto
16. Guilherme
21. Joana
26. Andreia
02. Anastcio
07. Carlos
12. Elisabete
17. David
22. Jorge
27. Luisa
03. Arnaldo
08. Cludio
13. Francisco
18. Raul
23. Joaquina
28. Maria Jos
04. Bartolomeu
09. Gabriel
14. Fernando
19. Sergio
24. Jos da Silva
29. M
a
Cristina
05. Joaquim
10. Marco
15. Andr
20. Nelo
25. Mauro
30. Bernardino
amostras

24
2009

3.1.1.1.4 - Amostragem em Cachos ou conglomerados
Consiste em retirar de forma aleatria os elementos por cachos em vez de unidades. til quando os elementos
da populao esto naturalmente por cachos e por isso devem ser tratados como grupos ou quando no
possvel obter uma listagem de todos os elementos da populao-alvo. Como exemplo de amostragem por
cachos podemos referir a escolha de um grupo de escolas C+S para avaliar o conhecimento que os alunos do 5
e 6 anos tm acerca da recolha e separao de resduos. Como seria muito difcil obter uma lista de todos os
alunos que frequentam aqueles anos e escolher aleatoriamente quais constituram a amostra recorre-se a
cachos (escolas) e dentro destas far-se- a seleco. importante reter que em qualquer tipo de agrupamento
(cachos ou estratos), a amostra s considerada probabilstica se os grupos foram escolhidos ao acaso antes
da repartio aleatria dos sujeitos nos grupos.
Uma amostra por cachos ou conglomerado uma amostra aleatria simples na qual cada unidade de
amostragem um grupo, um cacho ou um conglomerado de elementos.
O primeiro passo para se usar este processo especificar os cachos apropriados, j que todos os elementos
devem ter caractersticas similares. Como regra geral, o nmero de elementos em cada cacho deve ser pequeno
em relao ao tamanho da populao, mas o nmero de cachos deve ser, razoavelmente, grande.
Tanto no caso da amostragem estratificada como no da amostragem por cachos, a populao deve estar
dividida em grupos. Na amostragem estratificada, entretanto, selecciona-se uma amostra aleatria simples
dentro de cada grupo (estrato), enquanto que na amostragem por cachos seleccionam-se amostras aleatrias
simples de grupos, e todos os itens dentro dos grupos (conglomerados) seleccionados faro parte da amostra.

A amostragem por cachos recomendada quando:
Ou no se tem um sistema de referncia listando todos os elementos da populao, ou a obteno dessa
listagem dispendiosa;
O custo da obteno de informaes cresce com o aumento da distncia entre os elementos.


3.1.1.1.4 E1:
Suponha que se deseja estimar a despesa mdia mensal que uma familia tem com a sade numa cidade grande,
como deve ser escolhida a amostra?
amostras

25
2009
Soluo:
A amostragem aleatria simples invivel, pois pressupe uma listagem de todas as famlias da cidade, o que
praticamente impossvel de se obter.
A alternativa da amostragem estratificada tambm invivel, j que aqui tambm necessria uma listagem
dos elementos por estrato.
A melhor escolha amostragem por cachos. O sistema de referncia pode ser constitudo por todas as
freguesias da cidade. Cada freguesia um cacho. Extrai-se uma amostra aleatria simples das freguesias e
nelas pesquisa-se a despesa familiar em todas as casas.

3.1.2 As Amostragens No Probabilsticas:

um procedimento de seleco segundo o qual cada elemento da populao no tem a mesma probabilidade de
ser escolhido para formar a amostra. Este tipo de amostragem tem o risco de ser menos representativa que a
probabilstica no entanto muitas vezes o nico meio de construir amostras em certas disciplinas profissionais
nomeadamente na rea da sade. Este tipo de amostragens requerem critrios de incluso e excluso rgidos
para evitar o maior numero possvel de viezes. O tamanho da amostra neste tipo de amostragens muito
importante pois quanto maior for menor a probabilidade de que casos idiosincrticos possam afectar o todo
de uma forma significativa. Da que as amostras provindas deste tipo de amostragens devam ter sempre um n
suferior aquele que seria representativo do todo se utilizasse uma amostragem do tipo probabilistica

3.1.2.1. Tcnicas de Amostragens No-Probabilsticas:

A Amostragem Acidental ou de Convenincia (por substituio da aleatria simples);
A Amostragem por Cotas (por substituio da amostragem estratificada ou por cachos);
A Amostragem de Seleco Racional ou Tipicidade (por substituio da estratificada);
A Amostragem por Redes ou Bola de Neve (por substituio da sistemtica).

3.1.2.1.1 - Amostragem Acidental ou de Convenincia
formada por sujeitos facilmente acessveis, que esto presentes num determinado local e momento preciso.
Neste tipo de amostra tem a vantagem de ser simples de organizar e pouco onerosa, todavia este tipo de
amostra provoca enviesamentos, pois nada indica que as primeiras 30 a 40 pessoas sejam representativas da
populao-alvo. So utilizadas em estudos que no tm como finalidade a generalizao dos resultados. Esse
tipo de amostragem, embora no aleatria, bastante utilizada na rea da sade, geralmente so amostras
obtidas em consultrios, hospitais, etc. Neste caso, importante o senso crtico do pesquisador para evitar
vieses, por exemplo, no seleccionar sempre pessoas de mesmo sexo, de mesma faixa etria, etc. utilizando
critrios especficos de incluso/ excluso. Uma tcnica possvel de aproximar este tipo de amostragens o mais
possvel s probabilsticas ir verificando, medida que os dados vo sendo colhidos, se os seus subgrupos
esto, proporcionalmente populao alvo, representados na amostra.

amostras

26
2009
3.1.2.1.2 - Amostragem por Cotas
Idntica amostragem aleatria estratificada, j que constituda por um nmero pr-determinado de pessoas
em cada uma das vrias categorias da populao.
A amostragem por cotas difere da estratificada apenas pelo facto dos sujeitos no serem escolhidos
aleatoriamente no interior de cada cota ou de cada grupo.

3.1.2.1.3 - Amostragem por Seleco Racional, J ulgamento ou por Tipicidade
Tem por base o julgamento do investigador ou especialista para constituir uma amostra de sujeitos em funo
do seu carcter tpico ou atpico cujos membros tenham boas perspectivas de fornecerem as informaes
necessrias ao estudo. Por exemplo: o estudo de casos extremos ou desviantes como uma patologia rara ou uma
instituio.

3.1.2.1.5 - Amostragem por Redes ou Bola de Neve
Consiste em escolher sujeitos que seriam difceis de encontrar de outra forma. Toma-se por base, redes sociais
amizades e conhecimentos. Por exemplo: quando o investigador encontra sujeitos que satisfazem os critrios
escolhidos pede-lhes que indiquem outras pessoas de caractersticas similares.

3.2 Propriedades da distribuio normal

A distribuio Normal a mais familiar das distribuies de probabilidade e tambm uma das mais importantes
em estatstica. Esta distribuio tem uma forma de sino.

1 - A varivel aleatria X pode assumir todo e qualquer valor real.
2 - A representao grfica da distribuio normal uma curva em forma de sino, simtrica em torno da
mdia, que recebe o nome de curva normal ou de Gauss.
3 - A rea total limitada pela curva e pelo eixo das abscissas igual a 1, j que essa rea corresponde
probabilidade de a varivel aleatria X assumir qualquer valor real.
4 - A curva normal assinttica em relao ao eixo das abscissas, isto , aproxima-se indefinidamente do eixo
das abscissas sem, contudo, alcan-lo.
amostras

27
2009
5 - Como a curva simtrica em torno da mdia, a probabilidade de ocorrer valor maior que a mdia igual
probabilidade de ocorrer valor menor do que a mdia, isto , ambas as probabilidades so iguais a 0,5 ou 50%.
Cada metade da curva representa 50% de probabilidade.
Mas a curva afectada pelos valores numricos de e . Ver diagrama ao lado.
A notao para a distribuio gaussiana : ~N (, )


A rea sob a curva
normal (na verdade
abaixo de qualquer
funo de densidade de
probabilidade) 1.
Ento, para quaisquer
dois valores especficos
podemos determinar a
proporo de rea sob a
curva entre esses dois
valores.
Para a distribuio Normal, a proporo de valores caindo dentro de um, dois, ou trs desvios padro da mdia
so:
TABELA 2: DI STRI BUI O NORMAL E RESPECTI VOS DESVI OS
Amplitude Proporo
1 68.3%
2 95.5%
3 99.7%

Ou seja, a mdia mais ou menos um desvio, tem rea de 0,683 sob a curva, ou, uma probabilidade de 68,3%. A
mdia mais ou menos dois desvios tem probabilidade de 95,4% e a mdia mais trs desvios e menos trs
desvios, tem 99,7% de probabilidade

Quando a distribuio possui mdia zero e desvio-padro igual a um, ela chamada de distribuio gaussiana
padro. Uma varivel que tem a curva de Gauss padro como distribuio denotada pela letra Z e
representada por Z ~ N(0,1).

O clculo de probabilidade a rea sob a curva, e as tabelas trazem o valor da probabilidade calculada de
forma numrica. As tabelas com a distribuio gaussiana so padronizadas, ento, se a varivel no tem mdia
zero e desvio-padro igual a 1, necessrio padroniz-la:
Frmula para padronizar tabelas com distribuio gaussiana





amostras

28
2009








Para a distribuio normal, graficamente, tm-se

A distribuio normal calculada no intervalo P(a < Z < b) a rea dada :

ento pode-se escrever P(a < Z < b) = P(Z < b) - P(Z<a).

Exemplo: Seja X a varivel aleatria que representa a amplitude da onda R em V1 o padro
electrocardiogrfico normal em crianas. Vamos supor que essa varivel tenha distribuio normal com mdia
= 0,15 e desvio padro = 0,04. Qual a probabilidade de uma criana ter uma amplitude entre 0,15 e 0,2?
P ( 0,15 < X < 0,2) = ?
amostras

29
2009
Com o auxlio de uma distribuio normal reduzida, isto , uma distribuio normal de mdia = 0 e desvio
padro = 1. Resolveremos o problema atravs da varivel z , onde z = (X - ) / S. Utilizaremos tambm uma
tabela normal reduzida, que nos d a probabilidade de z tomar qualquer valor entre a mdia 0 e um dado valor
z, isto : P ( 0 < Z < z). Temos, ento, que se X uma varivel aleatria com distribuio normal de mdia e
desvio padro S, podemos escrever: P( < X < x ) = P (0 < Z < z)
No nosso problema queremos calcular P(0,15< X < 0,154). para obter essa probabilidade, precisamos, em
primeiro lugar, calcular o valor de z que correponde a x = 0,2
z = (0,2 0,15) / 0,04 = 1,25
Utilizao da tabela Z reduzida
TABELA 3: CURVA NORMAL - TABELA Z (REDUZI DA)

Procuremos, agora, na tabela Z o valor de z = 1,25
Na primeira coluna encontramos o valor at uma casa decimal = 1,2. Em seguida, encontramos, na primeira
linha, o valor 0,05, que corresponde ao ltimo algarismo do nmero 1,25. Na interseco da linha e coluna
correspondentes encontramos o valor 0,3944, o que nos permite escrever: P (0 < Z < 1,25 ) = 0,3944 ou 39,44
%, assim a probabilidade de uma certa criana apresentar uma amplitude da onda R em V1 entre 0,15 e 0,2
de 39,44 %.

Exerccios resolvidos do uso de z lendo uma tabela normal reduzida
amostras

30
2009
Qual a rea sob a curva normal contida entre z = 0 e z = 2 (ou z = -2)?
Procura-se o valor 2,0 nas linhas da tabela de z e o valor 0,00 na coluna. O valor da interseco de 0,4772,
ou seja, 47,72%. Entretanto, lembrando que a curva normal simtrica, sabe-se que a rea sob a curva contida
entre z = 0 e z = -2 tambm 47,72%, somam-seambas e a rea referente a -2 < z < 2 vale 95,44%.
Qual a rea sob a curva normal contida entre z = 0 e z = 3 (ou z = -3) ?
Procura-se o valor 3,0 nas linhas da tabela de z e o valor 0,00 na coluna. O valor da interseco de 0,4987,
ou seja, 49,87%. Sabe-se que a rea sob a curva contida entre z = 0 e z = -3 tambm 49,87% j que a curva
normal simtrica. Uma vez mais, somam-se ambas e a rea referente a -3 < z < 3 vale 99,74%.

Numa populao de indivduos adultos de sexo masculino, cuja frequncia cardiaca (FC) em mdia 84,98 e
desvio padro 14,45, qual o intervalo de frequncias cardiacas em que 95% da populao est
compreendido?
0,95/2=0,475
Procuremos na tabela o valor 0,475=1,96
95% = 84,98 1,96 x 14,45 (sendo que 1,96 * 14,45 = 28,322)
A maior FC ser: 84,98 + 28,322 = 113,302 e a menor FC ser: 84,98 - 28,322 = 56,658
Assim sendo, 95% da populao tem FC entre 57 e 113 batimentos por minuto (bpm).
Ser pouco provvel encontrar algum com FC superior a 113 bpm (P = 2,5%) ou abaixo de 57 bpm (P =
2,5%).

Na mesma populao, qual a probabilidade de um indivduo apresentar FC entre 80 e 100 bpm?
Calcula-se dois valores de z:
z
min
= (80 84,98) / 14,45 = -0,35
z
max
= (100 84,98) / 14,45 = -1,0
Consultando a Tabela de z, verifica-se que a rea entre z = 0 e z = -0,35 de 13,68 e a rea entre z = 0 e z = 1
de 34,13%.
Portanto, a probabilidade de se encontrar algum com estatura entre 1,60 e 1,82 m de:
0,1368 + 0, 3413 = 0,4781 = 47,81%
Qual a probabilidade de se encontrar 1 indivduo com FC menor que 58 bpm?
z = (58 84,98) / 14,45 = -1,9
Consultando a Tabela de z, verifica-se que a rea entre z = 0 e z = -1,9 47,13 (0,4713). Portanto, a rea alm
de z determina a probabilidade = 50 - 47,13 = 2,87%
Sabendo-se que o ndce de massa corporal numa populao de pacientes com diabetes mellitus obedece uma
distribuio normal e tem mdia = 27 kg/cm
2
e desvio-padro = 3 kg/cm
2
, qual a probabilidade de um indivduo
sorteado nessa populao apresentar um ndce de massa corporal entre 26 kg/cm
2
e a ?
amostras

31
2009
Como z = ( x - ) /, z = ( 26 - 27 ) / 3, z = - 0,333
Consultando a Tabela de z, verifica-se que a rea entre 26 e 27 igual a 0,1293. Portanto, a probabilidade de
um indivduo sorteado nessa populao ter indice de massa corporal entre esses valores 12,93%.
Quando uma amostra tem n > 30 uma curva binomial tende a assemelhar-se a uma curva normal. No caso de n
= 31 a distribuio (p + q) ter os seguintes valores:
Se p =0,5 q =0,5 Se p =0,75 e q =0,25
=15,5 e s =2,78 = 7,75 e s = 2,41
95% da distribuio est entre 10,05 e 20,95 95% da distribuio est entre 3,02 e 12,47
(Confira este resultado). (Confira este resultado).


4. Determinao do Tamanho da Amostra

Os tamanhos das amostras so relativos, isto , depende do tamanho da populao. Para determinar as
amostras existem vrias frmulas, consoante o parmetro em critrio. As mais utilizadas na sade so as que se
baseiam na percentagem (proporo) do fenmeno.
A amostra depende da extenso do universo; do Nvel de Confiana; do Erro Mximo permitido; da
percentagem com que o fenmeno se verifica. Os universos de pesquisa podem ser finitos ou infinitos.
Convencionou-se que os finitos so aqueles cujo nmero de elementos no excede a 100.000 e os infinitos, por
sua vez, so aqueles que apresentam elementos em nmero superior a esse.
Este tpico apresenta alguma dificuldade tcnica e s um conhecedor dos detalhes da situao, poder calcular
o tamanho da amostra necessria numa pesquisa especfica.

4.1 Clculo do Tamanho da Amostra para Populaes Infinitas

Relativamente aos clculos a efectuar neste ponto, limitar-nos-emos a apresentar algumas frmulas para
clculo do tamanho da amostra em duas situaes simples, admitindo que ser usada a amostragem aleatria
simples.

4.1.1.Proporo
Se o problema de partida do tipo dicotmico (presena ou ausncia do acontecimento ou fenmeno em estudo)
e queremos, com nvel de confiana, 1 que a proporo estimada esteja, no mximo, a uma distncia d da
proporo verdadeira (erro amostral, tambm denotado com a letra ), ou seja, se queremos que
O valor de n dado por onde
P uma estimativa preliminar de p; Q = 1 P e d (ou ) o maior desvio aceitvel ou erro amostral.

amostras

32
2009

As notaes mais comuns para esta frmula so
Frmula para populaes infinitas e varivel dicotmica

ou

Como obtemos o Z para a formula do clculo amostral?
Os estudos estatsticos aprofundados deram origem a uma tabela a que chamamos tabela de distribuio
normal padro e a essa tabela que vamos buscar o valor de Z para o nvel de confiana que pretendemos,
que o mtodo estatstico para expressar a nossa aproximao estimada ao valor da populao. Esta tabela ao
contrrio da tabela reduzida apresenta os valores padro
TABELA 4:DI STRI BUI O NORMAL PADRO

Comeamos por aplicar a
formula em funo do nvel
de confiana escolhido
1 . Se escolhemos um
de 5% para um o valor de
Z
2 / o
a consulta na tabela
2
2
2 /
' ' ] [
d
q p z
n
o
=
2
2
2 /
' ' ] [
c
o
q p z
n =
amostras

33
2009
resultar do clculo de 1-0,025=0,975. Procuramos este valor na tabela e Z ser igual contigencia da
primeira parte inteira e primeira decimal de Z com a segunda decimal de Z.
Mas se escolhemos um de 10% para um o valor de Z
2 / o
a consulta na tabela resultar do clculo de 1-
0,05=0,95. Procuramos
este valor na tabela e Z
ser igual
contigencia da
primeira parte inteira e
primeira decimal de Z
com a segunda decimal
de Z.


Exemplo: queremos realizar uma pesquisa de opinio pblica para determinar a proporo de pessoas que
sofreram leses respiratrias devido a contgio em meio hospitalar (visitas a familiares doentes, marcaes de
consulta, etc.). Quantas pessoas devero ser ouvidas para que sejam satisfeitas as seguintes condies: =
0,02, p = 10%, = 5%
Soluo:


4.1.1 E1:
Suponha que quer conhecer o valor de Z
2 / o
para um de 1% ?
Qual o resultado
4
?


4.1.1 E2:
Para um fenmeno que tenha uma prevalncia de 25%, quantas pessoas devero constituir a amostra para que
sejam satisfeitas as seguintes condies: = 0,05, p = 25%, = 5%
5
?
Resolva:




4

2 / o
z
=2,58
5

238
05 , 0
) 75 , 0 )( 25 , 0 ( ] 96 , 1 [ ' ' ] [
2
2
2
2
2 /
= = =
c
o
q p z
n

z tal que A(z)=0,95
Pela tabela z = 1,64 ou 1,65
Z
865
02 , 0
) 9 , 0 )( 1 , 0 ( ] 96 , 1 [ ' ' ] [
2
2
2
2
2 /
= = =
c
o
q p z
n
amostras

34
2009


4.1.1 E3:
Desejamos estimar, com uma margem de erro de 3%, a percentagem de motoristas profissionais que referem
sonolencia durante a conduo, considerando o=0,05. em que a proporo estimada de 18% esteja, no
mximo, a uma distncia [] da proporo verdadeira de 3%.
Quantos motoristas constituiriam a amostra?
6
Calcule.






Supondo que no tinhamos nenhuma estimativa de pa frmula de clculo deveria ser:

Frmula para populaes infinitas quando no temos nenhuma estimativa de p

2
2
2 /
25 , 0 ] [
c
o
z
n =

Com efeito, observando a tabelas da distribuio normal padro, f(x) j cobre 0,975 (
2
2 /
] [
o
z =1,96), pelo que
basta acrestentar o 0,25 na formula para que se cubra toda a area da distribuio (1).
4.1.1 E4:
E se no tivessemos nenhuma estimativa, quantos motoristas constituiriam a amostra se mantivessemos o
mesmo ?
7



6

631 0224 , 630
03 , 0
) 82 , 0 )( 18 , 0 ( ] 96 , 1 [ ' ' ] [
2
2
2
2
2 /
~ = = =
c
o
q p z
n

7

1068 1111 , 1067
03 , 0
25 , 0 ] 96 , 1 [ 25 , 0 ] [
2
2
2
2
2 /
= = = =
c
o
z
n

amostras

35
2009
o
p
= (p.q)
n
o
p
= (p.q)
n
4.1.2. Determinao da Margem de Erro da Amostra

A Margem de erro de uma amostra que, por sua vez, representa aproximadamente (e nunca exactamente) uma
populao lida assim:
se uma pesquisa tem uma margem de erro de 2% e a Doena Cardaca teve 25% de prevalncia na amostra
recolhida, podemos dizer que, naquele instante, na populao, ela ter uma prevalncia entre 23% e 27% (25%
menos 2% e 25% mais 2%).
Nvel de confiana As pesquisas so feitas com um parmetro chamado nvel de confiana, geralmente de
95%. Estes 95% querem dizer o seguinte: se realizarmos uma outra pesquisa, com uma amostra do mesmo
tamanho, nas mesmas datas e locais e com o mesmo instrumento de recolha de dados, h uma probabilidade de
95% de que os resultados sejam os mesmos (e uma probabilidade de 5%, claro, de que tudo difira).
Quando j se efectivou uma pesquisa e se deseja conhecer a margem de erro utilizada (no esquecer que uma
amostra sempre finita) aplica-se:
Frmula paraconhecer a margem de erro padro

Onde:
n = Tamanho da amostra
o
p
= Erro padro ou desvio da percentagem com que se verifica determinado fenmeno
p = percentagem do fenmeno
q = percentagem complementar


Exemplo: Numa pesquisa efectuada com 1000 adultos, verificou-se que 30% bebem caf pelo menos uma vez
por dia. Qual a probabilidade de que tal resultado seja verdadeiro para todo o universo.


Como o valor encontrado (margem de erro) corresponde a um desvio, ento para dois desvios (95,5%), temos
1,45 *2=2,90.
Para 3 desvios o triplo (4,35).
Isto significa que, por exemplo, para um nvel de confiana de 95% (2 desvios) o resultado da pesquisa
apresentar como margem de erro 2,90 para mais ou menos.
provvel, portanto, que o n. de consumidores de caf esteja entre 27,10% (30%-2,90) e 32,90% (30%+2,90).

o
p
= (30.70)
1000
o
p
= 1,45
o
p
= (30.70)
1000
o
p
= 1,45
amostras

36
2009
2
0
0
1
E
n =
0
0
.
n N
n N
n
+
=
2
0
0
1
E
n =
0
0
.
n N
n N
n
+
=

4.2. Clculo do Tamanho da Amostra para Populaes finitas

4.2.1. Proporo

Uma das formulas comummente aplicada no clculo das amostras finitas constituida por dois tipo de clculos:
A Primeira parte da amostra d-nos uma primeira aproximao do tamanho da amostra (n
0
), isto , um grupo
alvo para servir de apoio estatistico de clculo, pois sabemos que existem menos de 100.000 elementos e
embora no saibamos quantos existem sabemos que so demasiadas para partir do numero exacto (por exemplo
aproximadamente 20.000 elementos).

A segunda parte da amostra calculada a partir da primeira aproximao, que corresponde ao grupo alvo.





Frmula para populaes finitas

e

Onde:
N = tamanho da populao
E
0
= erro amostral tolervel
n
0
= primeira aproximao do tamanho da amostra
n = tamanho da amostra

Exemplo
N=200 famlias, E
0
=4%(0,04)
n
0
=1/(0,04)2 n
0
=625 famlias
n = 200x625/200+625 n = 152 famlias


amostras

37
2009
4.2.1 E1:
Para N=20.000 famlias qual o tamanho da amostra
8


4.2.1 E2:
Numa pesquisa para uma eleio presidencial, qual deve ser o tamanho de uma amostra aleatria simples, se se
deseja garantir um erro amostral no superior a 2%
9
?
Resolva


Numa escola com 1000 alunos, deseja-se estimar a percentagem dos que esto satisfeitos com a direco. Qual
deve ser o tamanho da amostra aleatria simples que garanta um erro amostral no superior a 5%
10
?
Resolva






4.2.2. Mdia

Quando utilizamos dados amostrais calcula-se um valor da estimativa do parmetro populacional e com isso
tem-se uma estimativa por ponto do parmetro analisado, contudo podemos no ter acesso a um ponto mdio
mas um intervalo mdio

8
n = 20.000x625/20.000+625 n = 623 famlias
9
n = n
0
= 1/(0,02)
2
= 1/0,0004 = 2500 eleitores
10
N = 1000 empregados
E
0
= erro amostral tolervel = 5% (E
0
= 0,05)
n
0
= 1/(0,05)
2
= 400 alunos
n = 1000x400/(1000+400) = 286 alunos

amostras

38
2009
Assim, o valor da mdia amostral ( x ) uma estimativa por ponto da mdia populacional (). De maneira
anloga, o valor do desvio padro amostral (s) constitui uma estimativa do parmetro (o)
Por exemplo, uma amostra aleatria de 200 alunos de uma universidade de 20.000 estudantes revelou uma
mdia amostral de 5,2. Logo x = 5,2 uma estimativa pontual da verdadeira nota mdia dos 20.000 alunos.

Neste caso necessrio:
Controlar o erro relativo da estimativa da mdia de uma caracterstica da populao, com nvel 1 - o
de confiana: ou seja, queremos:

Onde = mdia amostral,
= mdia populacional.

Neste caso o valor de n dado por

onde
s=desvio padro preliminar
r=erro relativo
=mdia preliminar


Exercicio resolvido:Quantos doentes devem ser examinados num servio de ressonncia magntica para se
determinar ao nvel o = 5% e com r = 10%, e durao mdia por atendimento, =40 minutos e s = 10
minutos?
Soluo:
Se

Ento:
=

2
=
1,96 10
0,1 40

2
= 24

amostras

39
2009
J uma estimativa por intervalo para um parmetro populacional um intervalo determinado por dois nmeros,
obtidos a partir de elementos amostrais, que se espera que contenham o valor do parmetro com dado nvel de
confiana ou probabilidade de (1 - o)%. Geralmente (1 - o)% = 90%, 95%, 99% so os mais usados.
Por exemplo, o intervalo (1,60 m; 1,64m) contm a altura mdia dos moradores do municpio X, com
nvel de confiana de 95%..

Note-se a necessidade de estimativas preliminares dos parmetros, o que constitui mais uma razo para se fazer
um estudo piloto.

1. Controlar o erro absoluto da mdia, ou seja, se quisermos que
O valor de n dado por

onde,
o = desvio padro populacional,
d = distncia da mdia estimada mdia verdadeira.

4.2.2 E1:

Quantos doentes devem ser examinados num servio de ressonncia magntica para se determinar a um Z
2 / o

de 95% com uma distncia da mdia estimada mdia verdadeira de 5% e desvio padro populacional de 12
minutos
11
?

Resolva:





11
=

2
=
1,96 12
5

2
= 23

You might also like