You are on page 1of 17

AMOSTRAGEM PROBABILSTICA O que uma amostragem probabilstica?

? uma amostra selecionada de tal forma que cada item ou pessoa na populao estudada tm uma probabilidade (no nula) conhecida de ser includa na amostra.

Mtodos de Amostragem Probabilstica:

Amostragem Aleatria Simples (AAS) Uma amostra escolhida de tal forma que cada item ou pessoa na populao tem a mesma probabilidade de ser includa. Se a populao tem um tamanho N, cada pessoa desta populao tem a mesma probabilidade igual a 1/N de entrar na amostra. Utilizamos uma tabela de nmeros aleatrios para sortear (com mesma probabilidade) os elementos da amostra. Tambm pode ser utilizada uma funo randmica: No Excel, por exemplo, temos a funo ALEATRIA ENTRE.

Amostragem Aleatria Sistemtica Os itens ou indivduos da populao so ordenados de alguma forma alfabeticamente ou atravs de algum outro mtodo. Um ponto de partida aleatrio sorteado, e ento cada k-simo membro da populao selecionado para a amostra. Amostragem Aleatria Estratificada

A populao inicialmente dividida em subgrupos (estratos) e uma subamostra selecionada a partir de cada estrato da populao

Amostragem aleatria Estratificada com Repartio Proporcional

Suponhamos que a populao subdividida em k estratos. Sejam:

N = o nmero de indivduos na populao n = o nmero de indivduos na amostra Ni = o nmero de indivduos contidos no i-simo estrato da populao ni = o nmero de indivduos contidos no i-simo estrato na amostra

os estratos devem ser o mais homogneos possveis com relao s caractersticas relevantes da pesquisa (variveis que se correlacionam fortemente com a varivel estudada) para um mesmo tamanho amostral, a amostragem aleatria estratificada com repartio proporcional mais precisa (menor varincia do estimador) do que a amostragem aleatria simples (AAS)

Amostragem Aleatria Estratificada com Repartio de Neyman (ou repartio tima) Se conhecermos a varincia de cada estrato populacional referente a varivel que estamos desejando estimar o seu parmetro, um mtodo mais adequado o da repartio de Neyman.

para um mesmo tamanho amostral a preciso maior para amostra aleatria estratificada com repartio de Neyman (repartio tima) do que para a amostra aleatria estratificada com repartio proporcional que por sua vez maior do que a amostra aleatria simples

Amostragem por Conglomerados A populao inicialmente subdividida inicialmente em subgrupos (estratos) e uma amostra de estratos selecionada (por exemplo, com probabilidade proporcional ao tamanho de cada estrato). A seguir, amostras so selecionadas dos estratos selecionados previamente.

A principal vantagem da amostra por conglomerados a de possibilitar considervel reduo de custos (em relao por exemplo a uma amostragem aleatria estratificada) para um mesmo tamanho amostral O mtodo costuma ser empregado quando no dispomos de um cadastro da populao (como no caso da amostragem sistemtica) e os custos de ser elaborado um cadastro para toda a populao muito elevado.

Erro amostra: A diferena entre a estatstica amostral e seu correspondente parmetro Uma distribuio de probabilidade consiste de uma lista de todos os possveis valores das mdias amostrais de um dado tamanho amostral constante selecionado da populao e a probabilidade de ocorrncia associada a cada mdia amostral.

Exemplo 1 Uma empresa tem 5 scios. Semanalmente, os scios relatam o nmero de horas de atendimento a clientes Scio 1 2 3 4 5 Horas 22 26 30 26 22

Dois scios so selecionados aleatoriamente. Quantas amostras distintas so possveis? O nmero de amostras distintas de dois elementos tomados em 5 objetos corresponde a:

Scios 1,2 1,3 1,4 1,5 2,3 2,4 2,5 3,4 3,5 4,5

Total 48 52 48 44 56 52 48 56 52 48

Mdia 24 26 24 22 28 26 24 28 26 24

Organize as mdias amostrais em uma distribuio de freqncias.

Mdia Amostral 22 24 26 28

freqncia 1 4 3 2

Freqncia Relativa(Probabilidade) 1/10 4/10 3/10 2/10

Calcule a mdia das mdias amostrais e compare-a com a mdia da populao. A mdia da populao :

A mdia das mdias amostrais :

Observe que a mdia das mdias amostrais igual a mdia populacional

TEOREMA DO LIMITE CENTRAL

Para uma populao com mdia e uma varincia , a distribuio amostral das mdias de todas as possveis amostras de tamanho n, geradas a partir da populao, ser aproximadamente normalmente distribuda com a mdia da distribuio amostral igual e varincia igual - assumindo que o tamanho amostral suficientemente grande, ou seja, . Em outras palavras, se a populao tem qualquer distribuio (no precisa ser necessariamente normal) com mdia igual a e varincia igual a , ento a distribuio amostral dos valores mdios amostrais normalmente distribuda com a

mdia das mdias (

) igual a mdia da populao ( , desde que n .

) e o erro

padro das mdias amostrais igual a

Note que o erro padro das mdias amostrais mostra quo prximo da mdia da populao a mdia amostral tende a ser. O erro padro das mdias amostrais calculado por:

o smbolo para o erro padro das mdias amostrais

o desvio padro da populao n o tamanho da amostra

Se no conhecido e (considerada uma amostra grande), o desvio padro da amostra, designado por s, usado para aproximar o desvio padro da populao, . A frmula para o erro padro torna-se:

onde

ESTIMATIVA DE PONTO Estimativa de ponto um valor (chamado um ponto) que usado para estimar um parmetro populacional Exemplos de estimativas de ponto so a mdia amostral, o desvio padro amostral, a varincia amostral, a proporo populacional, etc.

Exemplo: O nmero de itens defeituosos produzidos por uma mquina foi registrado em cinco horas selecionadas aleatoriamente durante uma semana de trabalho de 40 horas. O nmero observado de defeituosos foi 12,4,7,14 e 10. Portanto, a mdia amostral 9,4. Assim a estimativa de ponto para a mdia semanal do nmero de defeituosos 9,4.

ESTIMATIVA DE INTERVALO Uma Estimativa de Intervalo estabelece uma faixa de valores dentro da qual um parmetro populacional provavelmente cai. O intervalo dentro do qual um parmetro populacional esperado ocorrer chamado de intervalo de confiana. Os intervalos de confiana que so extensivamente usados so os de 95 % e 99 %. Um intervalo de confiana de 95 % significa que cerca de 95 % dos intervalos construdos similarmente contero o parmetro que est sendo estimado. Outra interpretao do intervalo de confiana de 95 % que 95 % das mdias amostrais para um tamanho de amostra especificado cairo a uma distncia mxima de 1,96 desvios padres da mdia populacional. Para o intervalo de confiana de 99 %, 99 % das mdias amostrais para um tamanho amostral especificado cairo a uma distncia mxima de 2,58 desvios padres da mdia populacional.

O IC de 95 % para a mdia populacional

dado por:

O IC de 99 % para a mdia populacional

dado por:

Em geral, um intervalo de confiana para a mdia, calculado por:

onde Z obtido da tabela de distribuio normal padro.

Exemplo 2 Uma universidade quer estimar o nmero mdio de horas trabalhadas por semana por seus estudantes. Uma amostra de 49 estudantes mostrou uma mdia de 24 horas com um desvio padro de 4 horas. A estimativa de ponto do nmero mdio de horas trabalhadas por semana 24 horas (mdia amostral). Qual o intervalo de confiana de 95 % para o nmero mdio de horas trabalhadas por semana ?

Usando a frmula anterior ( ) temos ou 22,88 a 25,12. O limite de confiana inferior 22,88. O limite superior de confiana 25,12. O grau de confiana (nvel de confiana) utilizado 0,95.

Interprete os resultados Se ns tivssemos tempo para selecionar aleatoriamente 100 amostras de tamanho 49 da populao de alunos do campus e calcular as mdias amostrais e os intervalos de confiana para cada uma destas 100 amostras, a mdia populacional (parmetro)

do nmero de horas trabalhadas estaria contida em cerca de 95 dos 100 intervalos de confiana. Cerca de 5 dos 100 intervalos de confiana no conteriam a mdia populacional.

Intervalo de Confiana para Uma Proporo Populacional Um intervalo de confiana para uma proporo populacional dado por:

onde: a proporo amostral

o erro padro da proporo amostral e dado por:

O intervalo de confiana construdo por:

onde: a proporo amostral Z o valor da varivel normal padro para o grau de confiana adotado. n o tamanho amostral

Exemplo 3

Um planejador financeiro est estudando os planos de mudana de jovens executivos. Uma amostra de 500 jovens executivos que possuem suas prprias casas revelou que 175 planejam vend-las e retirarem-se para o interior do Pas. Construa um intervalo de confiana de 98 % para o parmetro proporo populacional de executivos que planejam mudar para o interior.

Aqui n = 500, e Z = 2,33 (para )

O CI de 98 %

Interprete a resposta

Fator de Correo de Populao Finita Uma populao que tem um limite superior definido chamada de finita. Em estatstica, considera-se como populao finita quando a frao amostral maior do que 5 %). (ou seja, quando

Para uma populao finita, onde o nmero total de objetos N e o tamanho da amostra n, o seguinte ajuste feito para os erros padres da mdia amostral e da proporo amostral.

Erro padro da mdia amostral:

Erro padro da proporo amostral:

Este ajuste chamado de Fator de Correo de Populao Finita (FCPF)

Nota: se

, o fator de correo de populao finita ignorado.

Exemplo 4 A universidade do exemplo 2 quer estimar o nmero mdio de horas trabalhadas por semana pelos estudantes. Uma amostra de 49 estudantes mostrou uma mdia de 24 horas e um desvio padro de 4 horas. Construa um intervalo de confiana para o nmero mdio de horas trabalhadas se h somente 500 estudantes no campus.

Agora

. Portanto, temos que usar o FCPF

Selecionando uma Amostra H 3 fatores que determinam o tamanho de uma amostra, nenhum dos quais tendo uma relao direta com o tamanho da populao. Eles so: 1. O grau de confiana adotado 2. O mximo erro permissvel 3. A variabilidade da populao

Uma frmula de clculo conveniente para determinar o tamanho amostral n :

onde:

E o erro permissvel Z o valor da varivel normal padro associado ao grau de confiana adotado s o desvio padro da amostra piloto

Exemplo 5 Um grupo de consumidores deseja estimar a mdia de gasto mensal em eletricidade para um domiclio familiar simples em Julho. Baseado em estudos similares o desvio padro estimado como sendo R$ 20,00. Deseja-se construir um intervalo de confiana de 99 % com um erro mximo admissvel de amostra? . Qual deve ser o tamanho da

Tamanho Amostral para Estimativa de Propores A frmula para determinar o tamanho amostral no caso de estimativa de propores :

onde

a proporo estimada, baseada na experincia passada ou em uma amostra piloto Z o valor da varivel normal padro associado ao grau de confiana adotado. E o mximo erro permissvel que o pesquisador tolera.

Exemplo 6 Um clube deseja estimar a proporo de crianas que tem um cachorro. Se o clube deseja que a estimativa esteja no mximo afastada 3 % da proporo populacional, quantas crianas devem conter a amostra? Assuma um intervalo de confiana de 95 % e que o clube estimou, com base em experincia anterior, que aproximadamente 30 % das crianas tm um cachorro.

Estratificao de Amostras

Aprenda como construir amostras que geram resultados mais precisos, sem aumentar significativamente o tamanho da amostra. Amostragem probabilstica O processo mais comum de construo de amostras a amostragem probabilstica: parte-se da pressuposio que todos os elementos da populao/universo possuem a mesma probabilidade de serem includos na amostra. Por exemplo, podemos atribuir um nmero distinto a cada elemento da populao e efetuar sucessivos sorteios at completarmos o tamanho da amostra. Esta seleo dos elementos da populao que faro parte da amostra freqentemente se baseia em programas computacionais (como folhas de clculo) e/ou de calculadoras cientficas que implementam a funo RANDOM (ALEATORIZAO). Este processo de amostragem probabilstica equivale ento a considerar que todos os elementos da populao so homogneos, e sua participao na amostra equivale a um sorteio de loteria. O que so estratos? Muitas vezes a populao se divide, em sub-populaes, subconjuntos ou estratos, sendo razovel supor que em cada estrato a varivel de interesse (sendo estudada) apresente um comportamento substancialmente diverso. Por outro lado, pode-se supor que o comportamento razoavelmente homogneo dentro de cada estrato. Em tais casos, se o sorteio dos elementos da amostra for realizado sem se levar em considerao a existncia dos estratos, pode acontecer que os diversos estratos no sejam convenientemente representados na amostra, o que influenciara o resultado pelas caractersticas dos estratos mais favorecidos pelo sorteio. Evidentemente, a tendncia ocorrncia desta influncia ser tanto maior quanto menor for o tamanho da amostra. Para evitar este efeito, pode-se adotar uma amostragem estratificada. A amostragem estratificada consiste essencialmente em pr-determinar quantos elementos da amostra sero retirados de cada estrato. A pr-determinao pode ser feita de vrias formas, sendo as mais comuns chamadas de uniforme (onde se sorteia um nmero igual de elementos em cada estrato) e proporcional (onde o nmero de elementos sorteados em cada estrato proporcional ao nmero de elementos no estrato). A amostragem estratificada uniforme ser recomendvel se os estratos da populao forem pelo menos aproximadamente do mesmo tamanho. Caso contrario, ser prefervel a estratificao proporcional pelo fato de fornecer uma amostra mais representativa da populao. Por exemplo, se formos estudar uma varvel de comportamento de adultos que dependa de seu estado civil (solteiro, casado, divorciado, etc.), evidente que os estratos no so de tamanho uniforme. Se na faixa de idade sob estudo, 70% dos adultos so casados, 10% so solteiros e 20% esto em outras situaes, ento para construir, por exemplo, uma amostra composta por 800 indivduos, sortearmos de forma probabilstica, dentro de cada um dos estratos, 560 casados, 80 solteiros e 160 em outras situaes.

A estratificao pode levar em conta mais de um critrio: por exemplo, alm do estado civil, poderiamos pr-determinar a estratificao da amostra levando em conta faixas etrias (j que dispomos de informao detalhada da distribuio dos indivduos por faixa etria nos censos de populao). importante observar, entretanto, que a preciso de uma amostra no depende de unicamente da dimenso da populao, mas tambm da respectiva variabilidade. A variabilidade de um estrato elevada, quando os seus elementos tm caractersticas muito heterogneas. Tal situao implica que um estrato com maior varincia dever levar seleo de um maior nmero de unidades na amostra, quando comparado com um estrato com a mesma dimenso populacional mas menor varincia (maior homogeneidade). Em resumo, quanto maior for o estrato, maior deve ser a amostra respectiva. Mas se a variabilidade dentro de um estrato for maior, maior dever ser a respectiva sub-amostra. Este mtodo otimiza a amostra aplicada a um universo estratificado, razo pela qual tambm conhecida como distribuio estratificada otimizada. Estes princpios gerais da teoria da amostragem possuem aplicao prtica em vrias situaes, incluindo os comportamentos de consumo. A nvel geogrfico, por exemplo, os estratos mais urbanos apresentam comportamento de consumo mais heterogneos que os estratos com maior ndice de ruralidade, pelo que a uma amostragem desproporcional permite obter dados mais rigorosos, atravs de uma sobre-amostragem nas regies mais urbanas. Ponderao dos dados A aplicao de uma amostragem desproporcional, em comparao com uma distribuio proporcional, reduz a margem de erro de cada estrato, mas implica que na anlise final, que deve representar os resultados para a amostra toda, os clculos conjuntos de dois ou mais estratos tenham que ser sujeitos a uma calibragem (ou ponderao). Por exemplo, se um grupo representa 30% do universo, mas representa 40% da amostra total, por ser mais heterogneo, os valores resultantes tero que ser ponderados usando a frao 30/40. Aplicando estes fatores de ponderao para cada estrato, teremos a contribuiao de cada estrato para os resultados finais de acordo com o seu peso real no mercado todo, e no da sua participao na amostra.

Amostra Sistemtica
Suponha que uma empresa de telefonia fixa deseja saber o grau da satisfao de seus usurios com os servios prestados. O nmero de assinantes da ordem de 50.000 e ns desejamos selecionar uma amostra aleatria de 1.000 assinantes com o intuito de obter a avaliao sobre os servios. No caso da seleo de amostra aleatria simples de assinantes seria necessrio que tivssemos os assinantes numerados, seqencialmente de 1 a 50.000 e somente aps seriam selecionados os 1.000 assinantes. A seleo seria feita com o uso de uma tabela de nmeros aleatrios ou de software que gera esses nmeros. Com o advento da micro informtica esse problema minimizado quando dispomos o cadastro de assinantes em meio magntico Um modo alternativo de seleo a seleo de 1 assinante de cada 50. O procedimento ser selecionar aleatoriamente um assinante entre os primeiros 50, digamos que de ordem 20 fosse

selecionado. O prximo selecionado seria o de ordem 70, o seguinte de ordem 120 e assim por diante ou seja: 20, 70, 120, 170, 220 ....... . Com esse mtodo se economizam recursos fsico e financeiro. A amostra sistemtica freqentemente utilizada em pesquisas que obrigam que a seleo seja feita durante a etapa de coleta de dados, por pessoas que no esto familiarizadas com tabelas de nmeros aleatrios ou com uso de software. Para melhor entendimento vamos nos valer de um exemplo. Suponha que desejamos investigar 1 domiclio em cada 10 de uma determinada rua. Admita-se, ainda, que no temos um cadastro dos domiclios da rua. Assim ser necessrio se proceder uma listagem que relacione todos os domiclios. Suponha que foram listados 200 domiclios. Assim o tamanho da amostra ser igual a 20. Uma regra prtica seria de selecionar os domiclios na listagem em que o numero de ordem tivesse o final terminado em zero, ou seja, o de ordem 10,20,30,40,50 ....... Com esse procedimento os entrevistadores poderiam realizar simultaneamente o trabalho da listagem e aplicao dos questionrios.

Os assuntos so selecionados apenas porque eles so os mais fceis de recrutar para o estudo eo pesquisador no considerou selecionando temas que so representativas de toda a populao. Em todas as formas de pesquisa, seria ideal para testar toda a populao, mas na maioria dos casos, a populao muito grande que impossvel incluir todos os indivduos. Esta a razo pela qual a maioria dos pesquisadores contam com tcnicas de amostragem como amostragem por convenincia , o mais comum de todas as tcnicas de amostragem. Muitos pesquisadores preferem esta tcnica de amostragem porque rpido, barato, fcil e os assuntos esto prontamente disponveis. EXEMPLOS Um dos exemplos mais comuns de amostragem por convenincia utilizar estudantes voluntrios como sujeitos para a pesquisa. Outro exemplo usar temas que so selecionados a partir de uma clnica, uma classe ou uma instituio que facilmente acessvel ao pesquisador. Um exemplo mais concreto a escolha de cinco pessoas de uma classe ou escolher os cinco primeiros nomes da lista de pacientes. Nestes exemplos, o pesquisador inadvertidamente exclui uma grande proporo da populao. A amostra de convenincia ou uma coleo de temas que so acessveis ou uma auto-seleo de indivduos dispostos a participar, que exemplificado por seus voluntrios. USOS Pesquisadores usam amostragem por convenincia e no apenas porque fcil de usar, mas porque tambm tem vantagens outras pesquisas. Em estudos-piloto , amostra de convenincia normalmente usado porque ele permite ao pesquisador obter dados bsicos e tendncias a respeito de seu estudo, sem as complicaes do uso de uma amostra aleatria . Esta tcnica de amostragem tambm til na documentao que uma qualidade especfica de uma substncia ou fenmeno ocorre dentro de uma dada amostra. Esses estudos tambm so muito

teis para a deteco de relaes entre diferentes fenmenos. CRTICAS A crtica mais bvia sobre amostragem por convenincia a amostragem preconceito e que a amostra no representativa de toda a populao. Esta pode ser a maior desvantagem quando se utiliza uma amostra de convenincia, pois leva a mais problemas e crticas. Vis sistemtico decorre de vis de amostragem. Isso se refere a uma diferena constante entre os resultados da amostra e os resultados tericos a partir de toda a populao. No raro que os resultados de um estudo que utiliza uma amostra de convenincia diferem significativamente com os resultados de toda a populao. A consequncia de ter vis sistemtico a obteno de resultados distorcidos. Outra crtica importante sobre o uso de uma amostra de convenincia a limitao na generalizao e inferncia decises sobre toda a populao. Pois a amostra no representativa da populao, os resultados do estudo no pode falar por toda a populao. Isto resulta em uma baixa validade externa do estudo. NOTAS Quando se utiliza amostragem por convenincia, necessrio descrever a forma como a amostra ser diferente a partir de uma amostra ideal que foi selecionada aleatoriamente. Tambm necessrio para descrever os indivduos que podem ser deixados de fora durante o processo de seleo ou a indivduos que esto sobre-representados na amostra. Em conexo com isso, melhor se voc puder descrever os possveis efeitos das pessoas que ficaram de fora ou os assuntos que esto sobre-representados para os seus resultados. Isso permitir que os leitores de sua pesquisa para obter uma boa compreenso da amostra que voc estava testando . Ele tambm ir capacit-los para estimar a possvel diferena entre seus resultados e os resultados de toda a populao.

You might also like