Professional Documents
Culture Documents
UFPB
Reitor
Rafael Angel Torquemada Guerra
Rmulo Soares Polari
Coordenao de Tutoria
Pr-Reitor de Graduao
Coordenao Pedaggica
Isolda Ayres Viana Ramos
UFPB Virtual
Coordenao de Estgio
Coordenador
Paulo Csar Geglio
Renata Patrcia Jernymo Moreira
Edson de Figueiredo Lima Junior
Coordenao de TCC
Diretor
Apoio de Designer Instrucional
Antnio Jos Creo Duarte
Luizngela da Fonseca Silva
Departamento de Sistemtica e Ecologia
Chefe
C569CadernosCbVirtual2/RafaelAngel
TorquemadaGuerra...[etal.].
JooPessoa:Ed.Universitria,2011.
610p.:II.
ISBN:9788577459025
EducaoaDistncia.2.Biologia
I.Guerra,RafaelAngelTorquemada.
UFPB/BCCDU:37.018.43
ESTATSTICA VITAL
Gilmara Alves Cavalcanti
UNIDADE 1
ANLISE DE DADOS ESTATSTICOS
1. Situando a Temtica
A Estatstica considerada por alguns autores como Cincia no sentido do estudo de uma
populao. considerada como mtodo quando utilizada como instrumento por outra Cincia.
A palavra estatstica frequentemente est associada imagem de aglomerao de nmeros,
dispostos em uma imensa variedade de tabelas e grficos, representando informaes to
diversas como nascimentos, mortes, taxas, populaes, rendimentos, dbitos, crditos, etc. Isto
devido ao uso comum da palavra estatstica como sinnimo de dados, como, por exemplo,
quando falamos das estatsticas de uma eleio, estatsticas da sade, estatsticas de acidente de
trnsito ou as estatsticas de acidentes de trabalho.
No sentido moderno da palavra, estatstica lida com o desenvolvimento e aplicao de
mtodos para coletar, organizar, analisar e interpretar dados de tal modo que a segurana das
concluses baseada nos dados pode ser avaliada objetivamente por meio de proposies
probabilsticas.
O propsito da estatstica no exclusivo de qualquer cincia isolada. Ao contrrio, a
estatstica fornece um conjunto de mtodos teis em toda rea cientfica onde haja a necessidade
de se coletar, organizar, analisar e interpretar dados. Estes mtodos podem ser usados to
eficazmente em farmacologia como em engenharia, biologia, em cincias sociais ou em fsica.
2. Problematizando a Temtica
Ao estudarmos fenmenos naturais, econmicos ou biolgicos tais como, a precipitao de
chuvas em uma determinada regio, a evoluo da taxa de inflao em uma regio metropolitana,
a influncia das mars no desenvolvimento de animais marinhos, etc., estamos lidando com
experimentos cujos resultados no conhecemos e desejamos saber se as hipteses que
afirmamos so verdadeiras, isto , se os fenmenos esto ocorrendo como espervamos. Para
isto, necessrio que os dados oriundos das observaes possam nos dar informaes claras e
precisas. Estes dados devem ser organizados de forma adequada para podermos fazer uma
anlise crtica e fundamentada do fenmeno.
A partir de agora voc est convidado a participar de uma experincia que consiste em
obter um conjunto de dados, represent-lo em distribuies de frequncias e apresent-lo atravs
de tabelas e grficos. Ver como algumas medidas estatsticas podem nos auxiliar nesta anlise e
como utiliz-las.
385
3. Conhecendo a Temtica
3.1. Conceitos Bsicos de Estatstica
Podemos considerar a Estatstica como um conjunto de mtodos e processos
quantitativos que serve para estudar e medir os fenmenos coletivos.
A estatstica teve acelerado seu desenvolvimento a partir do sculo XVII, atravs dos
estudos de Bernoulli, Fermat, Pascal, Laplace, Gauss, Galton, Pearson, Fisher, Poisson e outros
que estabeleceram suas caractersticas essenciais. A Estatstica tem como OBJETIVO o estudo
dos fenmenos coletivos.
A Estatstica a cincia que trata da coleta, do processamento e da disposio dos
dados.
Objetivando o estudo quantitativo e qualitativo dos dados (ou informaes), obtidos nos
vrios campos da atividade cientfica, a Estatstica manipula dois conjuntos de dados
fundamentais: a "populao" e a "amostra".
Populao (ou Universo)
o conjunto dos seres, objetos ou informaes que interessam ao estudo de um fenmeno
coletivo segundo alguma(s) caracterstica(s). , portanto, um conjunto definido de informaes
relativas a qualquer rea de interesse, podendo, quanto ao nmero de elementos, ser: finita
(tamanho N) ou infinita. Na maioria das vezes no conveniente, ou mesmo possvel, realizar o
levantamento dos dados referentes a todos os elementos de uma populao. Portanto,
analisamos parte da populao, isto , uma amostra.
Amostra
um subconjunto no vazio ou parte da populao. Duas consideraes devem ser feitas
sobre o estudo amostral dos fenmenos. Uma diz respeito aos cuidados que se deve tomar para
assegurar que a amostra seja representativa da populao. Para atender a essa exigncia, devese selecionar os elementos de forma aleatria, de modo que todo e qualquer elemento da
populao tenha a mesma chance de participar da amostra, a outra diz respeito preciso dos
dados coletados, buscando minimizar os erros que poderiam induzir a concluses equivocadas. O
nmero de elementos de uma amostra chamado o tamanho da amostra, e denotado por n.
Definio 1.1: Parmetro
Uma caracterstica numrica estabelecida para toda uma populao denominada parmetro.
So valores, geralmente desconhecidos (e que, portanto, tm de ser estimados), que representam
certas caractersticas da populao.
386
Contnuas: So aquelas que podem assumir qualquer valor num certo intervalo de
medida, podendo ser associados ao conjunto dos nmeros reais, ou seja, um
conjunto no enumervel. Entre outras, enquadram-se nesta categoria as medidas
de tempo, comprimento, espessura, rea, volume, peso, velocidade, dosagem de
hemoglobina no sangue, concentrao de flor na gua oferecida populao, etc.
Discretas: Quando s podem assumir determinados valores num certo intervalo,
ou seja, um conjunto finito ou enumervel. Em geral, representam nmeros
inteiros resultantes de processo de contagem, como o nmero de alunos por sala,
de crditos por disciplinas, de pacientes atendidos diariamente num hospital, etc.
388
Em geral, uma mesma populao pode ser caracterizada por mais de um tipo de varivel. Assim,
os inscritos num vestibular, por exemplo, podem ser contados, medidos ou pesados, podem ser
agrupados segundo o sexo ou rea de estudo e podem ainda ser classificados segundo as notas
obtidas nas provas prestadas.
3.2. Fases do Experimento Estatstico
Em linhas gerais, podemos distinguir no mtodo estatstico as seguintes etapas:
Definio do
Problema
Planejamento
Anlise e Interpretao
dos Dados
Coleta dos
Dados
Tabelas e
Grficos
Crtica dos
Dados
Apresentao
dos Dados
"quem", "o que", "sempre", "por que", "para que", "para quando".
Imaginemos, por exemplo, que o Governo do Estado tenha necessidade de obter
informaes acerca do desempenho em Biologia dos estudantes matriculados na rede pblica de
ensino.
O primeiro trabalho da equipe encarregada da pesquisa ser, evidentemente, o de obter
respostas para aquelas perguntas. Seriam ento:
* Quem deseja as informaes?
* O que devemos perguntar no questionrio?
* A pesquisa ser peridica ou ocasional? Ser executada sempre?
* Por que desejam as informaes?
* Quando dever estar concluda a pesquisa?
* Qual a poca oportuna para a aplicao dos questionrios?
* Para que desejam as informaes?
Ainda na fase do planejamento, temos:
Por Via Direta: Quando feita sobre elementos informativos de registro obrigatrio (Exemplo:
fichas no servio de ambulatrio, nascimentos, casamentos, bitos, matrculas de alunos etc.) ou,
ainda, quando os dados so coletados pelo prprio pesquisador atravs de entrevistas ou
questionrios. A coleta direta de dados, com relao ao fator tempo, pode ser classificada em:
1.1. Contnua: Tambm denominada registro, feita continuamente, tal como a de
nascimentos e bitos, etc. Tambm so do tipo contnuo o registro de certas doenas,
como cncer, hansenase, tuberculose e tambm algumas doenas infecciosas agudas
com finalidade de controle.
1.2. Peridica: Quando feita em intervalos constantes de tempo, como os censos (de 10 em
10 anos), os balanos de uma farmcia, etc.;
1.3. Ocasional: Quando feita extemporaneamente, a fim de atender a uma conjuntura ou a
uma emergncia, como no caso de epidemias que assolam ou dizimam seres humanos
Por Via Indireta: Quando inferida de elementos conhecidos (coleta direta) e/ou conhecimento
de outros fenmenos relacionados com o fenmeno estudado. Como exemplo, podemos citar a
pesquisa sobre a mortalidade infantil, que feita atravs de dados colhidos via coleta direta.
3.2.4. Crtica dos Dados
Os dados colhidos por qualquer via ou forma e no previamente organizados so
chamados de dados brutos. Esses dados brutos, antes de serem submetidos ao processamento
estatstico propriamente dito, devem ser "criticados", visando eliminar valores imprprios e erros
grosseiros que possam interferir nos resultados finais do estudo. A crtica externa quando visa
s causas dos erros por parte do informante, por distrao ou m interpretao das perguntas que
lhe foram feitas; interna quando se observa o material constitudo pelos dados coletados. o
caso, por exemplo, da verificao de somas de valores anotados.
3.2.5. Apurao ou Processamento dos Dados (Apresentao dos Dados)
Uma vez assegurado que os dados brutos so consistentes, devemos submet-los ao
processamento adequado aos fins pretendidos. A apurao ou processamento dos dados pode
ser manual, eletromecnica ou eletrnica. Os processos e mtodos estatsticos aos quais os
conjuntos de dados podem ser submetidos sero nosso objeto de estudo nas sees seguintes.
3.2.6. Exposio ou Apresentao dos Dados (Tabelas e Grficos)
Por mais diversa que seja a finalidade que se tenha em vista, os dados devem ser
apresentados sob forma adequada (tabelas ou grficos), tornando mais fcil o exame daquilo
que est sendo objeto de tratamento estatstico. No caso particular da estatstica descritiva, o
objetivo do estudo se limita, na maioria dos casos, simples apresentao dos dados, assim
entendida a exposio organizada e resumida das informaes coletadas atravs de tabelas ou
quadros, bem como dos grficos resultantes.
3.2.7. Anlise e Interpretao dos Dados
391
:: SAIBA MAIS... ::
Sries Estatsticas: So os dados organizados em forma de tabelas. De acordo com
a poca de ocorrncia, o local e o fenmeno classificam-se, respectivamente, em:
a) Srie Temporal: Os dados so observados segundo a poca de sua ocorrncia.
b) Srie Geogrfica: Os dados so observados segundo o local onde ocorreram.
c) Srie Especificativa: Os dados so agrupados segundo a modalidade (espcie)
de ocorrncia.
d) Srie Mista ou de Dupla Entrada: Fuso de duas ou mais sries simples. Pode
ser visto como uma Tabela de Contingncia, a qual ocorre quando os elementos
da amostra ou da populao so classificados de acordo com dois fatores.
Exemplos:
SRIE TEMPORAL
SRIE ESPECIFICATIVA
Populao
1940
1950
1960
1970
41.236.315
51.944.397
70.119.071
93.139.037
Helmintos
Fonte: Internet.
Total
2000
7
9
22
33
Total
SRIE GEOGRFICA
240
1400
360
Percentual
Schistosoma
Enterobius
Necator
Ascaris
Urbana
Suburbana
Rural
SRIE MISTA
Tabela 4 Nmero de alunos segundo curso e
sexo. Natal, 2003.
Sexo
Curso
M
F
Biologia
Ecologia
8
1
6
3
Total
392
393
394
Quadro 1 Informaes sobre sexo, curso, idade (anos), procedncia, renda familiar, nmero de
disciplinas matriculado(a), peso (kg) e altura (cm) de 46 alunos matriculados na disciplina
Estatstica Vital (EV).
ID
SEXO
CURSO
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
Fem
Masc
Fem
Fem
Masc
Fem
Fem
Masc
Fem
Masc
Fem
Masc
Masc
Fem
Fem
Fem
Fem
Fem
Fem
Masc
Masc
Masc
Masc
Fem
Masc
Masc
Masc
Masc
Fem
Masc
Masc
Fem
Masc
Fem
Masc
Fem
Fem
Masc
Fsica
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Fsica
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
IDADE
(Anos)
19
18
18
18
18
20
20
19
19
18
18
21
18
18
18
19
19
18
23
18
21
19
19
17
18
19
17
21
18
21
21
18
21
19
18
17
19
19
PROCEDNCIA
Interior
Capital
Outra Regio
Capital
Capital
Interior
Interior
Capital
Outra Regio
Capital
Capital
Outra Regio
Interior
Interior
Capital
Capital
Capital
Capital
Outra Regio
Interior
Outra Regio
Capital
Outra Regio
Interior
Interior
Outra Regio
Interior
Interior
Interior
Outra Regio
Capital
Capital
Capital
Outra Regio
Capital
Capital
Capital
Capital
395
RENDA
NO. DISCIP.
PESO
ALTURA
FAMILIAR
MATRIC.
(kg)
(cm)
Mdia
Mdia
Mdia
Mdia
Mdia
Mdia
Mdia
Mdia
Mdia
Mdia
Mdia
Mdia
Mdia
No Info.
Mdia
Mdia
Mdia
Mdia
Mdia
Mdia
Mdia
Mdia
Mdia
Mdia
Baixa
Mdia
No Info.
Mdia
Mdia
Mdia
Mdia
Alta
Mdia
Mdia
Mdia
Mdia
Mdia
Mdia
6
6
6
6
6
6
6
6
3
6
6
5
6
6
6
6
7
6
6
6
6
6
6
6
6
6
6
5
5
6
6
6
5
6
6
6
6
6
47
75
61
56
80
44
52
67
48
83
53
66,5
78
46
54
56
53
57
53
76
65
78,5
104
47,5
67,5
61
68
75
58
65
67
47
69
68
53
51
63
60
156
167
169
163
178
158
158
174
167
180
163
175
180
158
160
162
160
164
160
180
171
180
183
155
175
160
169
178
154
165
178
167
179
170
166
153
168
166
39
40
41
42
43
44
45
46
Masc
Masc
Masc
Masc
Fem
Masc
Masc
Masc
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
Matem.
18
21
18
19
18
18
22
21
Capital
Interior
Interior
Interior
Capital
Outra Regio
Interior
Interior
Mdia
Mdia
Baixa
Mdia
Mdia
Mdia
Mdia
Mdia
6
5
6
6
6
6
6
6
72
54
60
75
52
100
80
50
174
163
165
181
160
175
179
166
k n ou k 1 + 3,3 log(n ) , se n 50
AT
k
396
1 Classe:
Limite Inferior: LI 1 = X min
2 Classe:
Limite Inferior: LI 2 = LS1
Limite Superior: LS 2 = LI 2 + h
i-sima Classe:
Limite Inferior: LI i = LS i 1
Limite Superior: LS i = LI i + h
Continue estes clculos at que seja obtido um intervalo que contenha o maior
valor da amostra (Xmx) entre seus limites.
8. Construa a tabela de distribuio de frequncias.
Uma tabela de distribuio de frequncias (por classes ou valores) dever conter as
seguintes colunas:
Nmero de ordem de cada classe (i) ou valor.
Limites de cada classe (no caso da distribuio de frequncias por classes).
o As classes so fechadas esquerda e abertas a direita.
o As observaes iguais ao limite superior da classe (i 1), o qual igual ao limite
inferior da classe i, pertencem classe i. NOTAO: |------.
LI i + LSi
.
2
o Observe que:
F = n.
i
i =1
Fi
.
n
k
= 1.
i =1
Faci = F1 + F2 +
+ Fi
397
25
24
25
30
23 22 23 26 25 33 23 35
24 22 24 22 24 21 22 28
28 29 24 25 20 27 34 26
22
Soluo:
Passo 1: Estabelecer o nmero de classes:
Passo 2: Amplitude Total:
21
24
26
35
22 22 22 22 22 22 23 23
24 24 24 24 24 25 25 25
26 27 27 28 28 29 30 30
36
k 33 6
AT = 36 20 = 16
AT 16
h=
=
2,7
k
6
398
:: ARREGAANDO AS MANGAS!! ::
DICA 1: Para construir a coluna indicadora (das classes) proceda da seguinte
forma: o primeiro valor do intervalo 1 o menor valor do rol, ou seja, 22. Esse o
LI (limite inferior) do primeiro intervalo. Para descobrir o seu LS (limite superior)
some a 22 o valor de h. Isto , 20 + 2,7 = 22,7. Assim, o primeiro intervalo ser:
22 |-- 22,7. Para o segundo intervalo repita o valor de 22,7 como sendo o LI do
intervalo 2. Para descobrir o seu LS some ao valor de h. Isto , 22,7 + 2,7 = 25,4.
Assim, o segundo intervalo ser: 22,7 |-- 25,4. Para o terceiro intervalo repita o
valor de 25,4 como sendo o LI do intervalo 3. Para descobrir o seu LS some ao
valor de h. Isto , 25,4 + 2,7 = 28,1. Assim, o terceiro intervalo ser: 25,4 |-- 28,1.
Faa isso sucessivamente at que se encontre o nmero de classes.
DICA 2: Para construir a coluna da Fi perceba que no primeiro intervalo: 20,0 |--22,7, o valor 20,0 incluso no intervalo (contabilizado no clculo das frequncias),
no entanto, o valor de 22,7 no ! Assim sendo, o valor de 22,7 s incluso no
intervalo seguinte. Volte ao rol e veja que existem 8 valores nesse intervalo (20 21
22 22 22 22 22 22). No segundo intervalo, 22,7 |--- 25,4, o valor 22,7
incluso no intervalo (contabilizado no clculo das frequncias), no entanto, o valor
de 25,4 no ! Assim sendo, o valor de 25,4 s incluso no intervalo seguinte.
Volte ao rol e veja que existem 13 valores nesse intervalo (23 23 23 24 24 24
24 24 24 25 25 25 25). Siga o mesmo raciocnio para os demais intervalos!
399
Joo
Ponto
Mdio
( pmi )
155,15
159,45
163,75
168,05
172,35
176,65
180,95
---
:: SAIBA MAIS... ::
Frequncia Absoluta: Corresponde a contagem dos valores do rol agrupados em
cada intervalo. No se preocupe, veja a dica 2 acima!
Frequncia Relativa: Calcule essa frequncia pedindo ajuda a frequncia
absoluta da seguinte forma: divida cada valor da frequncia absoluta pelo total.
Assim, no intervalo 1 teremos, 4/46 = 0,087. No que se refere ao intervalo 2, faa
8/46 = 0,174. E assim por diante para cada intervalo! Lembre-se que a soma das
frequncias relativas igual a 1.
Frequncia Absoluta Acumulada Abaixo de: Repita o primeiro valor da
frequncia absoluta. Em seguida, some cada valor a seguir nessa mesma coluna.
Isto , 4 + 8 = 12, 12 + 7 = 19, 19 + 10 = 29, e assim por diante!
400
Fonte: Quadro 1.
:: SAIBA MAIS... ::
Os grficos de setores podem ser teis se voc deseja comparar propores bsicas.
Geralmente fcil dizer primeira vista quais grupos tm uma frequncia alta em
comparao aos outros. No entanto, essa forma grfica pouco til se todas as
fatias tiverem tamanhos semelhantes, pois se torna difcil visualizar diferenas sutis
entre os tamanhos das fatias.
Diagrama de Coluna/Barras
Permitem comparar tamanhos relativos, mas
a vantagem de usar essa forma grfica que
ela permite um maior grau de preciso.
So ideais em situaes em que as
categorias tm praticamente o mesmo
tamanho, pois possvel identificar com
muito mais preciso qual a categoria tem a
frequncia mais alta. Torna-se mais fcil
enxergar as pequenas diferenas.
Cada
coluna/barra
representa
uma
determinada categoria, e o seu comprimento Fonte: Quadro 1.
indica o valor. Todas as colunas/barras tm
a mesma largura, o que facilita sua
comparao, e quanto mais longa maior o
valor.
401
:: SAIBA MAIS... ::
O grfico de colunas apresenta as categorias no eixo horizontal e a frequncia ou
porcentagem no eixo vertical. No grfico de barras os eixos so invertidos. As
categorias so mostradas no eixo vertical e a frequncia no eixo horizontal. Portanto,
as colunas so dispostas no sentido vertical e as barras no sentido horizontal. O
grfico de colunas tende a ser mais comum, mas grficos de barras so teis se os
nomes de suas categorias forem muito longos, pois do mais espao para mostrar o
nome de cada categoria.
402
Histograma
Histogramas so como grficos de colunas,
mas com duas importantes diferenas. A
primeira que a rea de cada coluna
proporcional frequncia, e a segunda que
no h espao vazio entre as colunas no
grfico.
a representao grfica de uma
distribuio de frequncias de varivel
quantitativa contnua (dados agrupados em
intervalos)
por
meio
de
retngulos
justapostos, centrados nos pontos mdios
das classes e cujas reas so proporcionais
s frequncias das classes.
Fonte: Quadro 1.
Polgono de Frequncia
outra forma de representar graficamente
uma distribuio de frequncias de varivel
quantitativa contnua (dados agrupados em
intervalos)
Corresponde a uma linha poligonal traada a
partir do ponto mdio de cada retngulo do
histograma, cuja rea total igual a do
histograma. Pode referir-se s frequncias
Fonte: Quadro 1.
absolutas ou s frequncias relativas, conforme
a escala utilizada no eixo vertical.
3.4. Medidas Estatsticas
Vimos anteriormente a sintetizao dos dados
sob a forma de tabelas, grficos e distribuies
de frequncias. Aqui, vamos aprender o clculo
de medidas que possibilitem representar um
conjunto de dados (valores de uma varivel
quantitativa, isto , informaes numricas),
relativos observao de determinado
fenmeno de forma reduzida.
403
404
bem provvel que j tenham lhe pedido para calcular a mdia antes. Uma forma
de achar uma mdia de um conjunto de nmeros somar todos os nmeros e, em
seguida, dividir o resultado pela quantidade de nmeros existentes.
Se voc quer aprender Estatstica ser necessrio se familiarizar com algumas
notaes estatsticas comuns. primeira vista pode parecer um pouco estranho,
mas voc vai se acostumar.
LETRAS E NMEROS
Quase todos os clculos estatsticos envolvem somar um conjunto de nmeros. Como exemplo,
se quisermos achar a idade mdia da turma, primeiro devemos somar as idades de todas as
pessoas que frequentam essa turma.
O interessante que se possa generalizar essa idia para qualquer conjunto de nmeros. Os
estatsticos resolvem essa questo usando letras para representar nmeros. Como exemplo,
podemos usar a letra X para representar as idades dos alunos da turma da seguinte forma:
Idades especficas dos
alunos da turma:
19 20 20 20 21
Cada X representa a idade de uma pessoa da turma. como identificar cada pessoa com um
nmero especfico.
Agora que temos uma forma geral de escrever as idades, podemos usar os nossos X para
represent-las nos clculos. Podemos escrever a soma das 5 idades da turma como:
Soma = X1 + X2 + X3 + X4 + X5
Mas e se no soubermos quantos nmeros temos de somar? E se no soubermos quantas
pessoas h na turma? Nesses casos no tem problema, basta chamar de n o nmero de valores.
Assim, se no soubssemos quantas pessoas havia na turma, diramos que havia n pessoas e
escreveramos a soma de todas as idades como:
Soma = X1 + X2 + X3 + X4 + X5 + ... + Xn = X ou ainda Xi
Observao: O smbolo representa o somatrio (Leia-se X como somatrio de X).
Podemos usar notao matemtica para representar a mdia. Se juntarmos todas essa
informaes podemos escrever a mdia como:
X=
X
n
405
Exemplo 1.6: Determinar a mdia do seguinte conjunto (amostra) de valores: 3, 7, 8, 10, 11.
Soluo: Perceba que, nesse caso, os dados esto em forma de rol.
X=
X
n
3 + 7 + 8 + 10 + 11
= 7,8
5
X =
( X .F )
i
Lembre-se que ao tratar com freqncias devemos nos lembrar que o conjunto de nmeros
pode estar agrupado em distribuies de frequncias por valor e em classes. Assim podemos
determinar a mdia seguindo o mesmo raciocnio. Acompanhe:
Exemplo 1.7 (Distribuio de Frequncias por Valor): Determinar a mdia do seguinte conjunto
(amostra) de valores: 2, 3, 8, 8, 5, 2, 2, 2, 8, 5, 3, 8, 2, 2, 5, 8, 2, 5, 8, 2
Soluo:
8
2
4
6
20
16
6
20
48
90
X =
( X .F ) = 90 X = 4,5
i
20
406
X =
( PM .F )
i
Freqncia.
Absoluta ( Fi )
Ponto Mdio
PMi
PMi.Fi
4
8
7
10
3
6
8
155,15
159,45
163,75
168,05
172,35
176,65
180,95
620,60
1275,60
1146,25
1680,50
517,05
1059,90
1447,60
Total ou
46
---
7747,50
Ento:
X=
( PM .F ) = 7747,50 = 168,42 cm
i
46
(X
n
i =1
X = 0.
Yi = X i c Y = X c ou Yi =
Xi
X
Y = , para c 0 .
c
c
407
:: SAIBA MAIS... ::
Se a mdia for enganosa devido a dados distorcidos e valores discrepantes ento
precisamos de alguma outra maneira de dizer qual o valor tpico. Isso pode ser feito
tomando o valor do meio, ou central. Esse um tipo diferente de mdia, ou medida
de posio chamada de mediana.
Mediana
Considere um conjunto de dados ordenados constitudo de n valores. A mediana o valor que
divide o conjunto em duas partes iguais (isto , em duas partes de 50% cada).
Notao: Med
Para achar a mediana da turma, alinhe todas as idades em ordem crescente (rol) e, em seguida,
escolha o valor central, da seguinte forma:
19
19
20
20
20
21
21
50
52
20
20
20
21
21
50
52
Se houver nmero par de pessoas na turma, no haver nenhum nmero exatamente no meio!
Nesse caso basta tirar a mdia dos dois nmeros do meio (some-os e divida por 2), essa
a sua mediana. Neste caso, a mediana 20,5.
Se voc tiver 9 nmeros, a mediana o nmero que est na posio 5.
Se voc tiver 8 nmeros, ela a mdia dos nmeros que esto nas posies centrais: 4 e 5.
E se voc tiver n nmeros? Nesse caso, observe o quadro abaixo:
COMO ACHAR A MEDIANA EM TRS PASSOS:
Alinhe seus nmeros em ordem crescente.
Se voc tiver um nmero mpar de valores, a mediana
o valor que est no meio. Se tiver n nmeros, o
nmero do meio est na posio (n + 1)/2.
Se voc tiver um nmero par de valores, ache a
mediana somando os dois valores do meio e dividindo
por 2. Esses dois valores so os elementos que esto na
posio: (n/2) e [(n/2) + 1].
408
Med =
n +1 5 +1 6
=
= = 30 elemento Me = 8
2
2
2
(n / 2) + [(n / 2) + 1] (4 / 2) + [(4 / 2) + 1] 20 + 30 7 + 8
Med =
=
=
=
= 7,5
2
2
2
2
TRABALHANDO COM DISTRIBUIO DE FREQUNCIAS EM CLASSES
No caso de dados agrupados, relembramos que uma distribuio de frequncias pode ser
representada por meio de um Histograma. Dizemos ento que a mediana ser o valor de X
(abscissa) cuja ordenada divide a rea total do Histograma em duas partes iguais.
Em uma distribuio de frequncias com dados agrupados em classes, denominamos classe
mediana a classe que contm o elemento que est na posio (n/2) e, consequentemente, ser
esta a classe que conter a mediana.
Figura 1: Clculo da mediana para dados distribudos em classes.
Clculo da mediana:
Med = LI med
n
Facant
+ 2
Fmed
hmed
onde:
* LImed o limite inferior da classe mediana;
* Fmed a frequncia absoluta da classe
mediana;
* Facant a frequncia absoluta acumulada da
classe anterior classe mediana;
* hmed a amplitude da classe mediana;
* n o nmero de observaes.
Assim, para dados agrupados em intervalos, a mediana obtida atravs de interpolao de
acordo com a frmula dada na Figura 1.
409
Med = LI med
n
Fant
+ 2
Fmed
46
19
2
4,3 = 165,9 + 1,72 = 167,62 cm .
hmed = 165,9 +
10
Propriedades da Mediana
1. A mediana no influenciada por valores extremos (grandes) de uma srie ou conjunto
de dados;
2. A mediana de uma srie de dados agrupados de classes extremas indefinidas pode ser
calculada.
Moda
Dado um conjunto ordenado de valores a moda o valor mais popular. A moda (so)
o(s) valor(es) que ocorre(m) com maior frequncia no conjunto de dados, ou seja (so) o(s)
valor(es) mais frequente(s). Ao contrrio da mdia e da mediana, a moda tem de ser um valor
existente no conjunto de dados.
As vezes os dados podem ter mais de uma moda. Se houver mais de um valor com a
frequncia mais alta, ento cada um desses valores uma moda. Acompanhe os tipos de sries
modais a seguir:
410
Notao: Mo
a) 2, 2, 3, 3, 5, 5, 8, 8
No existe moda (ou Amodal)
b) 2, 2, 3, 5, 5, 5, 8, 8
Mo = 5 (Unimodal)
c) 2, 2, 2, 3, 3, 5, 5, 5, 8 Mo = 2 e Mo = 5 (Bimodal)
TRABALHANDO COM DISTRIBUIO DE FREQUNCIAS
(a) Clculo da Moda em uma Distribuio de Frequncias por Valor
Basta olhar o elemento que ocorre com maior frequncia, ou seja, aquele que mais se
repete.
Exemplo 1.13: Suponha o Exemplo 1.7. Nesse caso, a maior frequncia absoluta (Fi) igual a 8
e o seu elemento correspondente (X) 2. Portanto, Mo = 2. Ao analisar a moda pode-se observar
que a maioria dos ninhos apresentaram 2 filhotes nascidos vivos.
(b) Clculo da Moda em uma Distribuio de Frequncias por Classes
Em uma distribuio de frequncias em classes, denominamos classe modal a classe que possui
a maior frequncia, e, consequentemente, ser esta classe que conter a moda.
Exemplo 1.14: Utilizando os dados apresentados na Tabela 5, determine a altura modal (Moda)
para dados agrupados em intervalos, a partir da frmula de Czuber apresentada na Figura 2.
Soluo:
A classe modal ser o intervalo com maior frequncia absoluta (f). Neste caso a classe
modal ser: 165,9 |----- 170,2 (4a classe). Assim, Lmo = 165,9.
hmo = 170,2 165,9 = 4,3.
1 = fmodal fanterior = 10 7 = 3, bem como, 2 = fmodal fposterior = 10 3 = 7
Da,
1
Mo = Lmo +
1 + 2
3
hmo = 165,9 +
4,3 = 167,19 cm.
3+7
411
1
hmo
Mo = Lmo +
2
1
onde:
* Lmo: Limite inferior da classe modal
* Lmo: Amplitude da classe modal
* 1 = fmodal fanterior
* 2 = fmodal fposterior
Observaes:
(i) A moda de um conjunto de dados pode no existir (Figura 3 (a)).
(ii) A moda de um conjunto de dados pode no ser nica (Figura 3 (c)).
Figura 3: Caracterizao de dados quanto moda.
412
Joo
Jos
10
Pedro
10
10
Amplitude Total
A amplitude nos diz quantos nmeros os dados abrangem, como se estivssemos medindo sua
largura. Para calcul-la tomamos o maior nmero do conjunto de dados (chamado de limite
superior LS) e, em seguida, subtramos do menor (chamado de limite inferior LI):
AT = LS LI
Notao: AT
Exemplo 1.15: Com base no exemplo anterior, a amplitude de cada aluno ,
Soluo:
* ATAntnio = 5 5 = 0
* ATJoo = 6 4 = 2
* ATJos = 10 0 = 10
* ATPedro = 10 0 = 10
A amplitude:
S descreve a largura dos dados e no como eles so dispersos entre os limites.
Pode medir at que ponto os valores esto dispersos, mas difcil ter uma idia real de como
os dados so distribudos.
uma excelente forma rpida de ter uma idia de como os valores so distribudos, mas um
pouco limitada.
TRABALHANDO COM A VARIABILIDADE
No queremos s medir a disperso de cada conjunto de pontos. Queremos alguma forma de
usar isso para ver se um aluno merecedor da bolsa. Em outras palavras, queremos medir a
variabilidade das notas dos alunos.
Uma maneira de fazer isso observar a distncia entre cada valor e a mdia aritmtica. Se
conseguirmos determinar um tipo de mdia para a distncia entre os valores e a mdia aritmtica,
teremos uma forma de medir a variao e a disperso. Quanto menor o resultado, mais prximos
os valores esto da mdia.
f
Pontos do Aluno 1
414
Pontos do Aluno 2
Os valores para este segundo conjunto de dados esto muito
prximos da mdia e variam menos. Se o professor escolher
esse aluno, ele ter uma boa ideia de como o aluno poder se
sair bem na prova.
Ento isso significa que basta calcular a mdia da distncia entre os valores e a mdia
aritmtica!
CALCULANDO DISTNCIAS MDIAS
Suponha que voc tenha trs nmeros: 1, 2 e 9. A mdia igual a 4. O que acontece se
acharmos a mdia da distncia entre esses valores e a mdia aritmtica?
distncia = 2
2
X =4
1
distncia = 3
Distncia mdia =
9
distncia = 5
(1 a X ) + (2 a X ) + (9 a X ) 3 + 2 + (5)
=
=0
3
3
A distncia mdia entre os valores e a mdia aritmtica sempre 0, visto que as distncias
positivas e negativas se cancelam umas s outras. Como resolver esse problema? Precisamos
achar uma maneira de fazer com que todas as distncias sejam positivas!
32 + 22 + (5) 2 9 + 4 + 25
(Distncia mdia) =
=
= 12,67 (at 2 casas decimais)
3
3
2
415
S2 =
(X
X)
n 1
S2 =
(X
X ).Fi
n 1
onde:
Xi o i-simo valor da varivel de interesse;
Fi a freqncia absoluta do i-simo valor;
X a mdia da amostra;
n o tamanho da amostra.
= n . A varincia da amostra
i =1
S2 =
( pm
X ).Fi
n 1
onde:
pmi o ponto mdio da i-sima classe;
Fi a frequncia absoluta da i-sima classe;
X a mdia da amostra;
n o tamanho da amostra.
:: SAIBA MAIS... ::
Os estatsticos utilizam muito a varincia para medir a disperso dos dados. Ela
til, pois utiliza cada valor para chegar ao resultado, e pode ser vista como uma
mdia do quadrado das distncias entre os valores e a mdia aritmtica. No entanto,
o que realmente deseja-se um nmero que nos d a disperso em termos da
distncia entre os valores e a mdia aritmtica, e no a distncia elevada a
quadrado.
416
O problema com a varincia que pode ser H uma maneira de corrigir isso. Basta tirar
difcil pensar em disperso em termos de a raiz quadrada da varincia. A isso
distncias elevadas ao quadrado.
chamamos de desvio-padro.
Desvio-Padro
Notao: o desvio-padro da populao ou desvio-padro populacional.
S o desvio-padro da amostra ou desvio-padro amostral.
outra medida de disperso mais comumente empregada do que a varincia, por ser expressa
na mesma unidade do conjunto de dados. Mede a "disperso absoluta" de um conjunto de
valores e obtida a partir da varincia. uma forma de dizer a que distncia os valores tpicos
esto da mdia aritmtica.
Desvio Padro =
Assim,
CV =
S
100%
X
OBS: X 0 .
Observe tambm que o coeficiente de variao adimensional e por este motivo permite a
comparao das variabilidades de diferentes conjuntos de dados.
Exemplo 1.16: Utilizando os dados apresentados na Tabela 5, determine a varincia, o desviopadro e o coeficiente de variao das alturas dos 46 estudantes de EV.
( pmi X ) 2 .Fi
Frequncia
Ponto Mdio
Absoluta (Fi )
(pmi)
155,15
159,45
163,75
10
168,05
172,35
176,65
180,95
Total ou
46
---
Altura (Xi)
417
3210,8294
Soluo:
S2 =
* Varincia:
( PM
X ) 2 . fi
n 1
* Desvio Padro: S =
3210,8294
= 71,35 cm2
46 1
S 2 = 71,35 = 8,45 cm
Anlise: Verifica-se uma variao de 8,45 cm nas alturas em torno da mdia observada.
* Coeficiente de Variao: CV =
S
8,45
.100 =
.100 = 5,02%
X
71,35
Anlise: Verifica-se uma variao relativa de 5,02% nas alturas em torno da mdia
observada.
importante expressar a variabilidade em termos relativos porque, por exemplo, um desviopadro igual a 1 pode ser muito pequeno se a magnitude dos dados da ordem de 1.000, mas
pode ser considerado muito elevado se esta magnitude for da ordem de 10.
Exemplo 1.17: Uma fbrica classifica operrios de acordo com os graus obtidos em testes de
aptido. Os dados so apresentados na distribuio de frequncia abaixo:
Notas do Teste
Fi
Faci
pmi
pmi Fi
( PM i X )
0 |----- 2
2 |----- 4
4 |----- 6
6 |----- 8
8 |----| 10
6
10
23
11
8
6
16
39
50
58
1
3
5
7
9
6
30
115
77
72
-4,17
-2,17
-0,17
1,83
3,83
Total ou
58
300
(PM
X)
(PM
X ) Fi
2
17,3889
4,7089
0,0289
3,3489
14,6689
104,3334
47,089
0,6647
36,8379
117,3512
40,149
306,2762
( PM . f ) = 300 = 5,17
58
S2 =
( PM
X )2 . fi
n 1
306,2762
= 5,37
57
c) A nota acima da qual esto 50% dos operrios chamada nota mediana, a qual
calculada para dados agrupados em intervalos por:
Med = LI Med
58
16
Facant
2
.2 = 4 + 26 = 4 + 1,13 = 5,13 .
.h = 4 + 2
+
Med
FMed
23
23
pm
F
i
i
k
k
2
i =1
2
( pmi X ) .Fi pmi Fi
n
.
S 2 = i=1
= i=1
n 1
n 1
Comentrios sobre as principais Medidas de Tendncia Central e Disperso:
1. O conjunto de todos os possveis elementos de uma determinada pesquisa constitui uma
populao estatstica. Sua mdia a mdia populacional, usualmente representada
pela letra grega . Na grande maioria das situaes prticas, a mdia populacional
desconhecida e deve ser estimada a partir de dados amostrais. Se a amostra for extrada
de forma adequada, a mdia amostral X uma boa estimativa de .
2. Comparando a mdia e a mediana, temos que a mediana pouco sensvel presena de
valores muito altos ou muito baixos na amostra, enquanto a mdia j muito sensvel a
esta situao. Para ilustrar o sentido desta afirmao, vamos considerar os dados abaixo:
5
14
47
61
122
620
47 + 61
= 54
2
5 + 14 + 47 + 61 + 122 + 620 869
=
= 144,8 .
A mdia dada por: X =
6
6
Observe que a maior observao (620) exerceu uma grande influncia sobre a mdia
(somente este dado maior do que a mdia), o que ento no sintetiza de forma
adequada as informaes contidas na massa de dados. Portanto, neste exemplo, a
mediana parece ser a melhor medida para indicar a localizao dos dados.
De modo geral, quando o histograma construdo para os dados da amostra do tipo
assimtrico, devemos preferir a mediana como medida de tendncia central.
3. A amplitude, apesar de ser muito fcil de calcular, tem a desvantagem de levar em
considerao apenas os dois valores extremos (mximo e mnimo) da massa de dados,
desprezando os demais.
419
420
UNIDADE 2
PROBABILIDADE
1. Situando a Temtica
A teoria das probabilidades o fundamento para a inferncia estatstica. O objetivo desta
parte que o aluno compreenda os conceitos mais importantes da probabilidade. O conceito de
probabilidade faz parte do dia-a-dia dos trabalhadores das reas das cincias exatas, cincias da
sade, cincias biolgicas, ecologia, engenharia, etc., uma vez que seu conceito
frequentemente usado na comunicao diria. Por exemplo, podemos dizer que uma espcie tem
30% de chance de ser extinta. Um laboratrio est 90% seguro de que um medicamento
proporcione a cura de uma doena. Um bilogo afirma que nas mars altas o peso seco das
ostras capturadas 20% maior que as capturadas em mars baixas. Um aluno tem chance de
70% de ser aprovado em uma determinada disciplina. Um professor est 95% seguro de que um
novo mtodo de ensino proporcione uma melhor compreenso pelos alunos. Um engenheiro de
produo afirma que uma nova mquina reduz em 20% o tempo de produo de um bem. Tal
como mostram os exemplos, as pessoas expressam a probabilidade em porcentagem.
Trabalhando com a probabilidade matemtica mais conveniente express-la como frao (as
porcentagens resultam da multiplicao das fraes por 100).
2. Problematizando a Temtica
O conceito de probabilidade fundamental para o estudo de situaes onde os resultados
so variveis, mesmo quando mantidas inalteradas as condies de sua realizao. Por exemplo,
jogando-se um dado, temos seis resultados possveis de cada vez; a observao do sexo dos
candidatos inscritos num concurso pblico conduz a dois resultados possveis masculino ou
feminino. Em ambos os casos, embora no sejamos capazes de afirmar de antemo que
resultado particular ocorrer, temos condies de descrever o conjunto de todos os resultados
possveis do experimento. A sua repetio continuada mostra certa regularidade nos resultados, o
que nos permite estudar o experimento, apesar da incerteza nele presente.
A VIDA CHEIA DE INCERTEZAS!
s vezes, pode ser impossvel dizer o que vai
acontecer de um minuto para o outro. Mas
certos eventos so mais provveis de ocorrer
do que outros, e a que entra em cena a
teoria da probabilidade.
A probabilidade permite prever o futuro
avaliando a probabilidade de os resultados
ocorrerem. Saber o que pode acontecer ajuda
voc a tomar decises mais embasadas.
421
Qual a probabilidade da
minha pasta ter ficado no
escritrio?
Respostas
H 38 casas
Apenas 1
1/38 = 0,026
Concluso
A probabilidade de a
bolinha parar no nmero
7 de 0,026. No
impossvel de acontecer,
mas no muito
provvel!
Respostas
P(9) = ?
H 1 casa para o nmero 9 e 38 casas no total (Idem nmero 7).
1/38 = 0,026
P(Preto) = ?
H 18 casas pretas e 38 casas no total.
18/38 = 0,474
P(Verde) = ?
H 2 casas verdes e 38 casas no total.
2/38 = 0,053
P(38) = ?
Esse evento impossvel, no h nenhuma casa com nmero 38.
Que tal agora conhecer os conceitos bsicos que cercam a teoria das probabilidades mais
formalmente?
422
3. Conhecendo a Temtica
3.1. Espaos Amostrais e Eventos
Antes de passarmos definio de probabilidade necessrio fixarmos os conceitos de
experimento aleatrio, espao amostral e evento.
Experimento Aleatrio (Notao: E)
o processo da coleta dos dados relativo a um fenmeno que acusa variabilidade em seus
resultados.
Caractersticas de um Experimento Aleatrio:
1) Todo experimento aleatrio poder ser repetido indefinidamente sob condies,
essencialmente inalteradas.
2) Embora no sejamos capazes de afirmar que resultado particular ocorrer, seremos
sempre capazes de descrever o conjunto de todos os possveis resultados do experimento.
Espao Amostral (Notao: S ou (mega))
o conjunto formado por todos os possveis resultados de um experimento aleatrio.
Eventos (Notao: A, B, C, ...)
qualquer subconjunto do espao amostral.
3.1.1. Operaes entre Eventos
Combinaes de Eventos
Sejam A e B eventos em um mesmo espao amostral. Temos as definidas as seguintes
operaes entre conjuntos:
INTERSEO
UNIO
EVENTOS DISJUNTOS
EVENTO COMPLEMENTAR
P ( A) =
:: SAIBA MAIS... ::
Probabilidades apenas indicam a chance de algo ocorrer, no so garantias.
importante lembrar que uma probabilidade indica apenas uma tendncia a longo
prazo. Ao jogar a roleta milhares de vezes voc esperaria que a bolinha parasse em
uma casa preta em aproximadamente 47% das vezes, e em uma casa verde em 5%
das vezes. Embora voc espere que a bolinha pare em uma casa verde com relativa
pouca freqncia, isso no significa que este evento no possa acontecer.
Preto
Vermelho
18
18
No h nada em
comum. Eventos
Exclusivos.
E os eventos pretos e pares? Desta vez no so mutuamente exclusivos. possvel que a bolinha
possa parar em uma casa que seja preta e par. Os dois eventos se interceptam, ou seja, no so
exclusivos.
Se dois eventos so mutuamente exclusivos,
apenas um dos dois pode ocorrer
Preto
8
Par
10
Estamos
compartilhan
do algo.
425
Par
10
8
P(Par sabendo que preta) = 10/18 = 0,556
Perceba que nessa situao a probabilidade calculada a partir de dois eventos condicionados.
Expressa a probabilidade de um evento acontecer, uma vez ocorrido outro evento. Que tal agora
conhecer os conceitos bsicos que cercam a teoria da probabilidade condicional mais
formalmente?
426
Bom Servio
Servio Deficiente
Com marca
64
16
80
Sem marca
42
78
120
Total
106
94
200
Dentro da Garantia
Total
P( M BS ) = 64 / 200 = 0,32 .
Todas essas probabilidades foram calculadas por meio da definio clssica de probabilidade.
Como a segunda dessas probabilidades P(BS) prxima a 0,50 (50%), vejamos o que acontece
se limitamos a escolha a vendedores de uma marca determinada.
Isto reduz o espao amostral as 80 escolhas, correspondentes 1a linha da tabela (com marca).
Temos ento, que a probabilidade de se escolher um vendedor que presta bons servios (BS),
sabendo (ou dado) que a marca de pneu vendido pelo mesmo determinada ser de
P( BS | M ) = 64 / 80 = 0,80 , tendo-se uma melhora em relao a P(BS) = 0,53. Note que a
probabilidade condicional que obtivemos aqui, P ( BS | M ) = 0,80 pode escrever-se como:
P( BS | M ) =
64
80
200
200
P( M BS )
P( M ) .
P( A B)
,
P( B)
desde que
427
P( B) > 0 .
P(B)
P(A B)
Teorema da Multiplicao
O resultado a seguir, obtido a partir da definio de probabilidade condicional, fornece a
probabilidade da ocorrncia conjunta de dois eventos A e B, isto , a probabilidade P(A B):
P( A B) = P( A) P(B | A)
ou
P( A B) = P(B) P( A | B)
428
Independncia de Eventos
Dizemos que dois eventos A e B so independentes, se as probabilidades condicionais
P(A | B) = P(A) e P(B | A) = P(B). Isto equivale, a partir da regra da multiplicao, escrever a
ocorrncia simultnea de A e B como sendo:
P( A B) = P( A) P( B)
429
4 3 2 1
=
6 5 4 5
Exemplo 2.3: Sejam A e B dois eventos tais que P(A) = 0,4 e P(A B) = 0,7. Seja P(B) = p. Para
que valor de p, A e B sero mutuamente exclusivos? Para que valor de p A e B sero
independentes?
Soluo:
Sabe-se de definies passadas que, A e B so mutuamente exclusivos se ( A B) = .
Logo, pelo teorema de probabilidade: P( A B) = 0 . Assim, a partir do teorema da soma
tem-se que:
No
caso
de
independncia
sabe-se
que:
Se
so
independentes
430
UNIDADE 3
VARIVEIS ALEATRIAS E DISTRIBUIES DE PROBABILIDADE
1. Situando a Temtica
Na unidade anterior estudamos alguns fenmenos probabilsticos por meio de espaos
amostrais mais simples. No entanto, em situaes prticas mais gerais, necessrio ampliar
esses conceitos para que tenhamos modelos probabilsticos que atendam as necessidades do
problema. A definio do conceito de varivel aleatria possibilitar uma maior flexibilidade e
aplicabilidade dos conceitos de probabilidade em problemas diversos.
2. Problematizando a Temtica
Ao estudarmos fenmenos aleatrios tais como, a renda de uma populao, o desempenho
escolar de um grupo de alunos, o impacto de uma dieta no peso de animais, etc., desejamos
saber como controlar esses experimentos e tentar extrair concluses sobre as respostas obtidas.
Neste caso, usaremos uma ferramenta valiosa que so as variveis aleatrias.
:: SAIBA MAIS... ::
Eventos improvveis acontecem, mas quais so as consequncias?
At ento, examinamos como saber a probabilidade de certos eventos. O que a
probabilidade no lhe diz o impacto geral desses eventos, e o que isso significa
para voc. Sim, com certeza, voc vai s vezes tirar a sorte grande na roleta, mas
ser que realmente vale a pena o risco com todo o dinheiro que voc perde nesse
meio tempo? Neste captulo, vamos mostrar-lhe como usar a probabilidade para
prever resultados a longo prazo e tambm medir a certeza dessas previses.
3. Conhecendo a Temtica
Quando na prtica desejamos investigar algum fenmeno, estamos na realidade
interessados em estudar a distribuio de uma ou mais variveis relacionadas a este. Assim, por
exemplo, podemos estar interessados em estudar a distribuio das notas de estudantes em uma
determinada disciplina, do grau de instruo, da altura, etc.
O que pretendemos, nesta unidade, apresentar alguns modelos tericos de distribuio
de probabilidade, aos quais um experimento aleatrio estudado possa ser adaptado, o que
permitir a soluo de um grande nmero de problemas prticos.
431
Cereja
Limo
Outros
1,00
0,2
0,2
0,5
A probabilidade de uma
cereja aparecer 0,2.
Os trs visores so independentes um do outro, o que significa que a figura que aparece em um
dos visores no tem efeito sobre as figuras que aparecerem em qualquer um dos outros.
PODEMOS CRIAR UMA DISTRIBUIO DE PROBABILIDADE EM DECORRNCIA DE SUA
COMBINAO PARA O CAA-NQUEIS.
Veja as probabilidades das diferentes combinaes de ganhar alguma coisa no caanqueis.
Combinao
Probabilidade
Nenhuma
Cerejas
Limes
Reais/Cerejas
Reais
0,977
0,008
0,008
0,006
0,001
Nenhuma
Cerejas
Limes
Reais/Cerejas
Reais
Ganho
R$1,00
R$9,00
R$4,00
R$14,00
R$19,00
0,977
0,008
0,008
0,006
0,001
Probabilidade
432
Nenhuma
Cerejas
Limes
Reais/Cerejas
Reais
14
19
0,977
0,008
0,008
0,006
0,001
A incgnita discreta. Isso significa que ela s pode assumir valores exatos!
Que tal agora conhecer os conceitos bsicos que cercam a teoria de variveis aleatrias mais
formalmente?
3.1. O Conceito de Varivel Aleatria e Variveis Aleatrias Discretas
Definio 3.1: Seja E um experimento e S (ou ) um espao amostral associado a E. Uma
funo X, que associe a cada elemento um nmero real, X(), denominada varivel
aleatria.
Observao:
1. Cada elemento de corresponder a
exatamente um valor;
2. Diferentes valores podem levar a um
mesmo valor de X;
3. Nenhum elemento poder ficar sem
valor de X.
Definio 3.2: Seja E um experimento e seu espao amostral. Seja X uma varivel aleatria
definida em e seja Rx seu contradomnio. Seja B um evento definido em relao a Rx, isto , B
Rx. Ento, define-se o evento A como:
A = { | X ( ) B} = X 1 ( B ) .
Assim, o evento A ser constitudo por todos os resultados em para os quais X() B.
Exemplo 3.1: Suponha 2 moedas lanadas e observada a sequncia de caras e coroas obtidas.
Considere o espao amostral associado a este experimento:
433
Soluo:
Espao Amostral: = {(Ca,Co), (Ca,Ca), (Co,Ca), (Co,Co)}
Agora, defina uma varivel aleatria X = nmero de caras obtidas no lanamento de 2
moedas. Assim, temos que X = {0, 1, 2}, visto que:
X(Co, Co) = 0
X(Ca, Co) = X(Co, Ca) = 1
X(Ca, Ca) = 2.
= p 1 + p 2 + ... + p n + ... = 1
F ( x i ) = P ( X = xi )
i =1
1/4
434
xi
Exemplo 3.3: Um par de dados lanado. Seja X a varivel aleatria que associa a cada ponto
(d1, d2) de a soma desses nmeros, isto , X(d1, d2) = d1 + d2. Determine a funo de
probabilidade de X.
Soluo:
O espao amostral formado de 36 pares ordenados, representando as possibilidades
nos lanamentos de dois dados = {(1, 1), (1, 2), (1, 3),..., (5, 6), ..., (6, 6)}.
Ento, a varivel aleatria X = d1 + d2 assume os seguintes valores X = {2, 3, 4, ..., 12}. Por
conseguinte, a funo de probabilidade de X obtida, calculando-se:
P (X = 2) = P(d1 = 1, d2 =1) = (1/6) (1/6) = 1/36
P (X = 3) = P(d1 = 1, d2 =2) + P(d1 = 2, d2 = 1) = (1/36) + (1/36) = 2/36
..
P (X = 12) = P(d1 = 6, d2 = 6) = 1/36
10
11
12
P(X = xi) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
DISTRIBUIO DE
PROBABILIDADES, VOC PODE
USAR ESSA INFORMAO PARA
DETERMINAR O RESULTADO
ESPERADO
435
Para achar o valor esperado, multiplique cada valor de x pela sua respectiva probabilidade de
ocorrncia e, em seguida some os resultados. De forma bem simples:
= E ( X ) = xi p( xi ) ,
i =1
se a srie
xi p ( xi )
i =1
convergir, ou seja,
xi
i =1
p( xi ) < .
14
19
0,977
0,008
0,008
0,006
0,001
436
Exemplo 3.4: Considere a varivel aleatria definida no exemplo 3.2. Obtemos a E(X) por:
Soluo:
3
1 1
1
E ( X ) = xi p( xi ) = 0 + 1 + 2 = 1
4 2
4
i =1
2 = V ( X ) = E ( X 2 ) [E ( X )]2 ,
onde: E ( X 2 ) = xi2 p( xi ) .
i =1
437
x
x
1
2
P(X = x)
9
2
4
2
14
19
( 1) = 1
(9) = 81
(4) = 16
(14) = 196
(19) =361
0,977
0,008
0,008
0,006
0,001
:: ARREGAANDO AS MANGAS!! ::
At agora vimos como calcular e usar as distribuies de probabilidade, mas
no seria bom se tivssemos algo mais fcil com que trabalhar ou apenas
mais rpido de calcular? A seguir vamos apresentar algumas distribuies
de probabilidade especiais que seguem padres muito bem definidos.
Continue lendo para que possamos apresent-lo a distribuio Binomial.
3.4. Experimentos Binomiais e a Distribuio Binomial
Dentre as funes de probabilidade, apresentaremos inicialmente uma distribuio discreta de
grande importncia, denominada Distribuio Binomial. Em seguida, faremos estudo de uma
distribuio contnua de grande utilizao na teoria da probabilidade, chamada a Distribuio
Normal.
Para utilizar a teoria das probabilidades no estudo de um fenmeno concreto, devemos encontrar
um modelo probabilstico adequado a tal fenmeno. Entendemos por modelo probabilstico para
uma varivel aleatria (v.a) X, uma forma especfica de funo de distribuio de probabilidade
que reflita o comportamento de X. As propriedades bsicas de um modelo probabilstico devem
ser:
Adequao: O modelo deve refletir adequadamente o mecanismo aleatrio que ocasiona
variao nas observaes;
Simplicidade: Utilizao, sempre que possvel, de hipteses simplificadoras, de modo que
o modelo se preste anlise estatstica, sem sacrifcio de adequao;
Parcimnia de Parmetros: Um nmero excessivo de parmetros prejudicaria a anlise
estatstica. Entre dois modelos que constituam aproximao adequada de um fenmeno,
devemos preferir aquele que apresente o menor nmero de parmetros.
Distribuio de Bernoulli
Suponha que realizamos um experimento E, cujo resultado pode ser observado e classificado
como sucesso ou fracasso, caso o evento que nos interessa ocorra ou no, respectivamente.
Associe p, a probabilidade de sucesso, ao evento que nos interessa e (1 p) = q, a probabilidade
de fracasso. Definimos, ento, a seguinte varivel aleatria discreta:
0, se ocorrer fracasso
.
X =
1, se ocorrer sucesso
A distribuio de probabilidade de X definida por:
xi
P(X = xi) (1 p)
Verifica-se que:
E(X) = p e V(X) = p(1 p),
que so as principais
caractersticas da varivel
aleatria X.
n
P ( X = k ) = p k (1 p) n k , k = 0,1, n ,
k
pois, para X = k teremos observado k sucessos, cada um com probabilidade p e
conseqentemente (n k) fracassos, cada um com probabilidade q = (1 p).
Notao: X ~ Bin(n, p) equivale a dizer que X
tem distribuio Binomial com parmetros n e p.
n!
Propriedades:
OBS: =
k k!(n k )!
representa o nmero de ensaios (n) em
k tentativas.
E(X) = np
V(X) = npq
Exemplo 3.5: Dois times de futebol, A e B, jogam entre si 6 vezes. Suponha que as
probabilidades do time A ganhar, perder ou empatar sejam as mesmas e permaneam constantes
durante as 6 partidas. Encontre a probabilidade do time A ganhar 4 vezes e calcule a esperana e
a varincia.
Soluo:
Seja X = Nmero de vezes que o time A ganha.
X ~ Bin(n, p)
X ~ Bin(6, 1/3)
Note que o time A pode ganhar, perder ou empatar, assim sendo: p = 1/3 (probabilidade de
vencer, que corresponde ao sucesso) e, q = 2/3 (perder ou empatar, que corresponde ao
fracasso). Alm disso, eles jogam entre si 6 vezes, portanto, n = 6.
Logo, a probabilidade do time A ganhar 4 vezes dada por:
6
20
P ( X = 4) = (1 / 3) 4 (1 1 / 3) 6 4 = 15 (1 / 3) 4 (2 / 3) 2 =
0,08 .
243
4
440
6
6!
6! 6.5.4! 6.5 30
OBS : =
=
=
=
=
= 15
2.1 2
4 4!(6 4)! 4!2! 4!2!
Esperana (mdia) de vitrias ser: E ( X ) = np = 6
1
=2
3
1 2 4
= .
3 3 3
Varincia: V ( X ) = npq = 6
n
P ( X = k ) = p k (1 p) nk lembrando que a combinao dada por:
k
E o valor esperado e a varincia?
E(X) = np
n
n!
=
k k!(n k )!
V(X) = npq
Veja o esboo da freqncia mostrando a quantidade de tempo que Jnior passa esperando seus
amigos:
F
Minutos
0
20
DISTRIBUIES
SITUAES
DE
PROBABILIDADE
DISCRETAS
NO
RESOLVEM
TODAS
AS
f ( x) =
(x )2
2
exp
, - < x < +, - < < +, > 0.
2
2
2
2
443
f(x) tem uma assntota. A partir do topo, a curva cai gradativamente at formar as caudas que
se estendem indefinidamente, aproximando-se cada vez mais da linha base sem, entretanto,
jamais toc-la.
Fixando-se a mdia, verifica-se que o achatamento da curva est diretamente ligado ao valor
do desvio padro , ou seja, quanto maior for o desvio padro, mais achatada a curva, como
pode ser vista na figura abaixo.
444
2 = 20,25
Tambm precisamos saber qual intervalo de valores nos dar a rea de probabilidade correta.
Necessitamos de um exemplo! Portanto, imagine que Jnior deseja achar a probabilidade de que
algum dos seus amigos seja mais alto que ele. Jnior tem 64 polegadas de altura.
= 71
64
445
=0
= 71
Desloque para esquerda
71 unidades
X 71
~ N (0; 1)
4,5
Ou, Z ~N(0; 1) onde:
X 71
Z=
4,5
Comprima a distribuio
dividindo pelo desvio-padro.
Este o escore padro. De
modo geral voc pode achar
o escore padro para
qualquer varivel Normal X
usando:
Z=
=1
Agora ache Z para o valor especfico para o qual voc deseja achar a probabilidade
At agora vimos como nossa distribuio de probabilidades pode ser padronizada para ir de X ~
N(; 2) a Z ~ N(0; 1). Aquilo que mais nos interessa so as probabilidades reais. O que
precisamos fazer tomar o intervalo de valores para o qual queremos achar as probabilidades e
achar o escore padro do limite desse intervalo. Em seguida, podemos consultar a probabilidade
para o nosso escore padro usando as tabelas de probabilidade normal.
Em nosso exemplo, deseja-se calcular a probabilidade de que tenha algum amigo mais alto do
que Jnior. Precisamos achar P(X > 64). O limite desse intervalo 64 e, por isso, se calcularmos
o escore padro z de 64, poderemos us-lo para achar nossa probabilidade. Portanto,
Z=
64 71
= 1,56 (com duas casas decimais)
4,5
Ento 1,56 o escore padro de 64, usando a mdia e o desvio padro das
alturas de Jnior e seus amigos. Agora que temos essa informao podemos
passar para a etapa final, usando tabelas para consultar probabilidades.
Perceba que nos ltimos pargrafos falamos sobre distribuio normal padronizada. Que tal
pararmos um pouco agora para sermos apresentados formalmente a essa to importante
distribuio? Continue lendo e aprendendo! No se esquea que logo em seguida temos o ltimo
passo para encontrar nossa to sonhada probabilidade!
446
Z=
Esta nova varivel chama-se varivel normal padronizada, ou reduzida, sendo sua
mdia igual a zero ( = 0) e o seu desvio padro igual um ( = 1).
Demonstrao:
X E( X )
=
=0
=
2
X V (X ) 0
=
=1
Varincia: V ( Z ) = V
=
2
2
Mdia: E ( Z ) = E
b
a
b
a
P ( a X b ) = P
Z
=
,
onde (z) = P (Z z), a funo de distribuio acumulada de N(0; 1).
PASSO 03: CONSULTE A PROBABILIDADE NA SUA TABELA
Agora que temos o escore padro, podemos usar as tabelas de probabilidade para responder a
pergunta do nosso amigo Jnior e achar a nossa probabilidade. As tabelas de probabilidade
normal permitem consultar qualquer valor z e, depois, ler a probabilidade correspondente P(Z < z).
Comece calculando z com 2 casas decimais. Este o valor que voc vai precisar consultar na
tabela. Para consultar a probabilidade, preciso usar a primeira coluna e a linha superior para
achar seu valor z. A primeira coluna d o valor de z com 1 casa decimal (sem arredondar) e a
linha superior d a segunda casa decimal. A probabilidade onde as duas se interceptam!
Como exemplo, se quisesse achar P(Z < 0,86), voc acharia 0,8 na primeira coluna, 0,06 na linha
superior, e encontraria uma probabilidade de 0,8051.
448
:: SAIBA MAIS... ::
As tabelas de probabilidades possibilitam que voc consulte a probabilidade P(Z < z),
onde z algum valor. O problema que voc nem sempre deseja achar esse tipo de
probabilidade; s vezes, voc deseja achar a probabilidade de que uma varivel
aleatria contnua seja maior que z, isto , P(Z > z), ou ainda, esteja entre dois
valores, P(a < Z < b). Como usar as tabelas para achar a probabilidade que voc
procura?
* Achando P(Z > z): Nesse caso, diminua da probabilidade total a rea onde Z < z.
Em outras palavras, use: P(Z > z) = 1 P(Z < z).
* Achando P(a< Z < b): Nesse caso, calcule P(Z < b) e diminua a rea de P(Z < a).
Em outras palavras, use: P(a< Z < b) = P(Z < b) P(Z < a).
Exemplo 3.9: Os salrios mdios dirio dos bilogos de uma empresa so distribudos segundo
uma distribuio normal com mdia de R$ 50,00 e desvio padro de R$ 4,00. Encontre a
probabilidade de um operrio ter um salrio dirio abaixo de R$ 52,00?
Soluo:
Seja X = o salrio dirio dos funcionrios. Interesse: Encontrar P (X < 52). Assim,
52
52 50
:: SAIBA MAIS... ::
Dica:
Trs importantes informaes que iro facilitar o clculo de probabilidades
envolvendo a distribuio normal padro, a partir da tabela que voc baixou na
plataforma MOODLE: (i) a tabela que voc est utilizando apresenta as
probabilidades de P(Z z0) = F(z0), ou seja, a funo de distribuio acumulada. No
entanto, esta tabela considera apenas valores positivos para Z. (ii) a rea total sob a
curva equivale a 1. Logo, a metade da curva representa probabilidade igual a 0,5; (iii)
a curva da normal simtrica. Essa propriedade ser bastante til no clculo de
probabilidades onde os valores de Z so negativos, ou seja, P(X x0) = 1 P(X +
x0).
449
UNIDADE 4
TEORIA ELEMENTAR DA AMOSTRAGEM
1. Situando a Temtica
Amostragem uma rea da Estatstica que estuda tcnicas de planejamento de pesquisa
para possibilitar inferncias sobre uma populao a partir do estudo de uma pequena parte de
seus componentes, uma amostra.
2. Problematizando a Temtica
Ao fazermos uma jarra de suco e adicionamos acar desejamos saber se a quantidade de
acar foi satisfatria. Para isto, no precisamos tomar toda a jarra de suco, uma colher basta. Da
mesma forma, ao estudarmos um fenmeno probabilstico em uma populao no precisamos
investigar toda a populao, e sim uma amostra dela. No entanto, algumas questes podem
surgir: Como obter essa amostra? Qual deve ser o tamanho dessa amostra? Esta unidade tem
como objetivo responder esta e mais algumas questes correlatas.
A ESTATSTICA TRABALHA COM DADOS, MAS DE ONDE VM OS DADOS?
Algumas vezes, fcil colher dados, tais como as idades das pessoas que
frequentam uma academia de ginstica ou os nmeros das vendas de uma
empresa fabricante de jogos. Mas e quando os dados so difceis de colher?
s vezes, difcil saber por onde comear a colher dados devido ao grande
nmero de coisas envolvidas. Neste captulo, vamos examinar como colher
dados de forma eficaz na vida real, com eficcia, preciso, economia de
tempo e dinheiro. Bem-vindo a mundo da amostragem!
COMO FUNCIONAM AS AMOSTRAGENS?
Populao
Amostra
Amostragem
3. Desenvolvendo a Temtica
3.1. Conceitos Bsicos
Muitas vezes faz-se necessria a coleta de dados diretamente na origem. Entretanto,
quando impossvel se observar toda a populao recorremos s tcnicas de amostragem, onde
450
nos limitamos a uma amostra da populao em estudo. Basicamente, nosso objetivo coletar
uma pequena frao da populao de modo que as informaes observadas na amostra possam
ser generalizadas para a populao. Para que esta generalizao seja possvel, os integrantes da
amostra devem ser escolhidos adequadamente.
Antes de aprofundarmos nosso discurso, vamos definir alguns termos necessrios:
Populao Objeto: a populao de interesse sobre a qual desejamos obter informaes
(Exemplo: peas produzidas em uma fbrica);
Populao de Estudo: o conjunto de indivduos de interesse especfico (Exemplo:
peas que permanecem em estoque);
Caracterstica Populacional: Aspectos da populao que interessam serem medidos ou
observados (Exemplo: dimetro da pea);
Unidade Amostral: Definida de acordo com o interesse do estudo, podendo ser uma pea,
um indivduo, uma fazenda, etc. Tal escolha deve ser feita no incio do estudo;
Estrutura Amostral ou Amostra: o conjunto de unidades amostrais (Exemplo: o
conjunto das peas selecionadas).
importante ressaltar que existem dois tipos de amostragem, a saber:
Amostragem Probabilstica: o procedimento atravs do qual existe uma probabilidade
conhecida e diferente de zero (p) para cada elemento da populao ser escolhido para
constituir a amostra;
Amostragem No-Probabilstica: Quando, no processo de seleo, no existe nenhum
mecanismo probabilstico para selecionar os indivduos da populao para constituir a
amostra.
:: ARREGAANDO AS MANGAS!! ::
Defina sua populao alvo: A primeira coisa a se deixar bem claro qual a sua
populao alvo para que voc saiba de onde est colhendo sua amostra.
Populao alvo o grupo que voc est pesquisando e para o qual deseja colher
resultados e, depende, em grande parte, da finalidade do seu estudo.
Defina as unidades amostrais: Uma vez definida a populao alvo, preciso
decidir para que tipo de objeto voc vai colher amostras.
Defina seu plano amostral: Por ltimo, voc precisa de uma lista de todas as
unidade amostrais dentro da sua populao alvo. basicamente uma lista a partir
da qual voc pode escolher sua amostra.
451
1. Amostragem Aleatria (ou Casual) Simples: Neste tipo de plano, supe-se que todos os
elementos da populao tm igual probabilidade de pertencer amostra, ou
alternativamente, se todas as possveis amostras, de mesmo tamanho, tm a mesma
probabilidade de serem selecionadas. Normalmente, consideramos esse tipo de plano
amostral quando a populao homognea. Esse processo de amostragem pode ser feito
com ou sem reposio do elemento amostrado. Uma tcnica que garante esta igual
probabilidade a seleo aleatria de elementos, por exemplo, atravs de sorteio.
2. Amostragem Sistemtica: Inicia com uma escolha aleatria de um elemento da
populao e, a partir deste, usa-se um sistema de seleo para compor o restante da
amostra. Por exemplo, numa listagem de elementos da populao, sorteamos um entre os
dez primeiros da lista o 5o elemento. A partir do elemento sorteado, selecionamos um a
cada quinze elementos (o 20o, o 35o e assim por diante). Este mtodo de amostragem
pode ser utilizado quando se quer planejar um perodo de tempo para execuo da coleta
de dados ou quando se deseja cobrir um determinado perodo de tempo com a amostra
estudada. Tambm consideramos esse tipo de plano amostral quando a populao
homognea.
3. Amostragem Estratificada: Na amostragem estratificada a populao dividida em
grupos internamente homogneos (estratos) e em seguida selecionada uma amostra
aleatria de cada estrato. Este tipo de amostragem usado quando o evento estudado
numa populao tem caractersticas distintas para diferentes categorias que dividem esta
populao, ou seja, dentro de cada estrato os elementos so bastante semelhantes entre
si e, entre os estratos eles so heterogneos. Assim, a estratificao apropriada para
agrupar os elementos por sexo, faixa etria, religio, escolaridade ou em populaes
heterogneas como rendas, produes agrcolas, produes industriais, etc.
4. Amostragem por Conglomerados: A populao dividida em pequenas subpopulaes,
com elementos internamente heterogneos, chamadas conglomerados (clusters).
Seleciona-se uma amostra aleatria simples desses conglomerados, e deles selecionamse aleatoriamente os elementos que iro compor a amostra. Assim, numa pesquisa scioeconmica pode-se dividir a cidade em bairros (conglomerados), em seguida obter uma
amostra aleatria de bairros e, ento efetuar o levantamento estatstico nas residncias
dos bairros selecionados. Observe que, no caso da estratificao, indivduos sero
selecionados em cada estrato, enquanto no caso da diviso da populao em
conglomerados, selecionamos apenas parte dos conglomerados.
5. Amostragem por Estgios Mltiplos: Esta estratgia de amostragem pode ser vista
como uma combinao de dois ou mais planos amostrais. Considere por exemplo uma
populao estratificada onde o nmero de estratos muito grande. Ao invs de obter uma
amostra aleatria de cada estrato, o que poderia ser invivel devido quantidade de
estratos, o pesquisador poderia optar por selecionar aleatoriamente alguns estratos e em
seguida selecionar uma amostra de cada estrato selecionado. Neste caso, teramos uma
amostragem em dois estgios usando, nas duas vezes, a amostragem aleatria simples,
sendo que no primeiro estgio as unidades amostrais so os estratos e no segundo so as
componentes da populao.
452
importante ressaltar que certos cuidados dever ser tomados no processo de obteno de
uma amostra, ou seja, no processo de amostragem, pois muitas vezes erros grosseiros e
concluses falsas ocorrem devido a falhas nesse processo.
:: SAIBA MAIS... ::
Exemplo de Amostragem Estratificada: Podemos dividir gomas de mascar nas
diferentes cores (amarelo, verde, vermelho e cor-de-rosa). Cada cor representa um
estrato diferente. Uma vez feito isso, voc pode fazer a AAS em cada estrato para ter
certeza de que cada grupo esteja representado na sua amostra global.
Exemplo de Amostragem por Conglomerados: Gomas de mascar podem ser
vendidas em pacotes, onde cada pacote contm um nmero semelhante de gomas
de mascar com cores diferentes. Cada pacote forma um conglomerado. Retira-se
uma AAS de conglomerados e, em seguida, faz a pesquisa com tudo que est dentro
de cada um desses conglomerados selecionados.
Var(X1) = 2
Var(X2) = 2
...
E(Xn) =
X=
Var(Xn) =
X1 + X 2 ++ X n
n
Existem muitas possveis amostras de tamanho n que poderamos ter tomado. Cada amostra
possvel composta por n embalagens, o que significa que cada amostra composta por n
observaes independentes de X. O nmero de gomas de mascar em cada embalagem escolhida
aleatoriamente segue a mesma distribuio de todas as outras, e calculamos o nmero mdio de
gomas de mascar para cada amostra da mesma maneira.
Podemos formar uma distribuio a partir de todas as mdias amostrais de todas as
amostras possveis. Isso chamado de distribuio amostral das mdias.
3.2.1. Distribuio da Mdia Amostral
A distribuio amostral das mdias nos d uma maneira de calcular
probabilidades para a mdia de uma amostra. Para calcularmos a
probabilidade de qualquer varivel, primeiro preciso saber sobre sua
distribuio de probabilidades, isto significa que, se voc quiser calcular
probabilidades para a mdia amostral, preciso saber como so
distribudas as mdias amostrais.
A distribuio amostral da mdia X uma distribuio que mostra as probabilidades de
obter os possveis valores das mdias amostrais. Vamos supor uma populao {1, 3, 5} com N = 3
elementos e a varivel aleatria X assumido o valor do elemento na populao, com a seguinte
distribuio de probabilidade:
xi
1
P(X = xi) 1/3
3
1/3
454
5
1/3
Observe que a distribuio acima tem mdia (valor esperado) e varincia dados por:
1+ 3+ 5
(1 3) 2 + ( 3 3) 2 + (5 3) 2 8
2
=3 e Var(X) = =
= .
E(X) = =
3
3
3
Se retirarmos todas as amostras aleatrias de tamanho n = 2, com reposio, dessa populao
obtemos um total de Nn = 32 = 9 amostras com os seguintes resultados:
(1,1)
(1,3)
(1,5)
(3,1)
(3,3)
(3,5)
(5,1)
(5,3)
(5,5).
xi
P( X = xi ) 1/9
2/9
3/9
2/9
1/9
A sua varincia igual varincia da populao dividida pelo tamanho da amostra. Temos
2
que: V ( X ) = E ( X 2 ) E ( X ) .
1
2
3
2
1 93
.
Logo, E ( X 2 ) = 12 + 2 2 + 3 2 + 4 2 + 5 2 =
9
9
9
9
9 9
8
2
93
93
93 81 12 4
2
Assim, V ( X ) = E ( X 2 ) E ( X ) =
. Tais relaes
32 =
9=
= = = 3=
9
9
9
9 3 2
n
entre e X , e 2 e X2 , observadas no exemplo acima, podem ser generalizadas.
Usando a teoria das probabilidades possvel mostrar que os seguintes resultados gerais so
vlidos com relao distribuio amostral da mdia. Seja X uma varivel aleatria com valor
esperado E(X) = e varincia V(X) = 2 finita, isto , 0< 2 < . Seja X a mdia desta varivel
aleatria, obtida de amostra aleatria de tamanho n, selecionada com reposio. Ento, temos
que:
E( X ) = X = ;
V( X ) = X2 =
455
2
n
Alm disso, tem-se o resultado conhecido como Teorema Central do Limite: Seja X uma
varivel aleatria com valor esperado E(X) = e varincia V(X) = 2. Para n suficientemente
grande,
1 n
X = Xi
n i =1
apresenta, aproximadamente, uma distribuio normal com mdia e varincia ( 2 / n) , Logo,
2
X N ,
n
X
e Z =
N (0,1) .
X2 = V( X ) =
2 N n
(3) Para valores grandes de n (n 30) a aproximao da distribuio amostral da mdia X pela
distribuio Normal considerada satisfatria.
Exemplo 4.1: Os registros de uma agncia de turismo mostram que um turista gastou, durante o
ltimo ano, em mdia = US$ 800,00, sendo o desvio padro dos gastos igual a = US$ 80,00.
Ache a probabilidade de que uma amostra de 64 turistas apresente um gasto mdio entre US$
770,00 e US$ 825,00.
Soluo:
Considere a varivel X = gastos (em US$). Embora a distribuio de X no seja conhecida,
como o tamanho da amostra n = 64 bastante grande, podemos admitir que a mdia
amostral de X segue a distribuio Normal com parmetros:
80
X = = 800 e X =
=
= 10 .
n
64
Assim temos que
770 800
X
825 800
= P( 3,0 Z 2,5) =
P(770 X 825) = P
10
10
Ufa, entendi! Veja bem, de um modo geral, voc espera que o nmero
mdio de gomas de mascar por embalagem de uma amostra seja igual ao
nmero mdio de gomas de mascar por embalagens da populao. Em
nossa situao, o nmero mdio de gomas de mascar em cada
embalagem da populao 10 e, portanto, isso o que voc espera para
a amostra tambm!
Ento, como fazermos para achar a distribuio das propores amostrais?
Continuando com a populao de gomas de mascar: foi fornecida a proporo de gomas de
mascar vermelhas na populao, e podemos represent-la por p. Em outras palavras, p = 0,25
(25% das gomas de mascar so vermelhas).
Cada caixa jumbo de gomas de mascar , na verdade, uma amostra de gomas de mascar colhida
na populao. Cada caixa contm 100 gomas de mascar; logo o tamanho da amostra 100, e
ser representado por n.
Seja a varivel aleatria X = Nmero de gomas de mascar vermelhas na amostra, ento: X ~
Bin(n; p), onde n = 100 e p = 0,25. A proporo de gomas de mascar vermelhas da amostra
depende de X. Isso significa que a proporo em si uma varivel aleatria. Podemos representla por p , onde p = x / n .
No sabemos o nmero exato de gomas de mascar vermelhas na amostra,
mas sabemos sua distribuio.
H vrias amostras possveis com tamanho n que poderamos ter colhido. Cada amostra possvel
compreenderia n gomas de mascar e o nmero de gomas de mascar vermelhas em cada uma
delas seguiria e mesma distribuio. Para cada amostra, o nmero de gomas de mascar
vermelhas distribudo conforme Bin(n; p).
Podemos formar uma distribuio a partir de todas as propores amostrais usando todas as
amostras possveis. Isso chamado de distribuio amostral de propores.
3.2.2. Distribuio Amostral da Proporo
Se o parmetro de interesse p representa uma proporo (ou percentagem) de elementos
com certa caracterstica (atributo) na populao, ento chamamos a estatstica correspondente na
amostra de proporo amostral, denotando-a por:
457
p.q e
p p
p N p,
Z=
N (0,1) .
n
p.q
n
No caso de uma populao finita de tamanho N e uma amostra sem reposio, recomenda-se o
uso do fator de correo populacional no clculo da varincia de p , sendo expressa por:
p.q N n
.
V( p ) =
n N 1
Exemplo 4.2: Suponha que de um grande lote de produo, 10% dos itens produzidos
apresentam algum tipo de defeito. Em uma amostra aleatria de tamanho 60, obtida do lote para
inspeo de qualidade, calcule a probabilidade de ter mais de 15% dos itens defeituosos.
Soluo:
p p 0,15 0,10
P( p > 0,15) = P
>
= P( Z > 1,29) = 1 0,9015 = 0,0985 .
p.q
0,1 0,9
60
n
Se considerarmos um grande nmero de amostras, cada uma contendo 60 itens, em
aproximadamente 9,85% das amostras a proporo de itens defeituosos seria superior a
15%.
Entendi! A distribuio amostral da proporo , na verdade, uma
distribuio de probabilidade formada pelas propores de todas as
amostras possveis de tamanho n. Se soubermos como so distribudas
as propores poderemos us-la para achar as probabilidades referentes
proporo de uma determinada amostra.
458
UNIDADE 5
INTERVALOS DE CONFIANA E TESTES DE HIPTESES
1. Situando a Temtica
Quando estudamos fenmenos probabilsticos estudamos tambm o comportamento de
alguns parmetros relacionados a este experimento. Tais parmetros, muitas vezes, so
impossveis de serem determinados restando-nos apenas tentar estim-los da melhor forma
possvel. Os procedimentos para tal estimao, juntamente com o fato de termos certeza que
estamos obtendo uma boa estimativa para o parmetro, ser abordado nessa unidade quando
estudaremos intervalos de confiana e testes de hiptese.
2. Problematizando a Temtica
Qual a altura mdia do povo brasileiro? Qual a proporo de pessoas com nvel superior
em Joo Pessoa? A resposta para essas perguntas no so to fceis, mas para respond-las
com exatido teramos que medir todos os cidados brasileiros ou verificar quantos habitantes em
Joo Pessoa possuem nvel superior, o que impossvel. No entanto se coletarmos uma amostra
e calcularmos a mdia e a proporo, respectivamente, ser que essas estimativas esto
prximas dos verdadeiros valores populacionais (parmetros)? Outra pergunta seria a seguinte:
Se a quantidade mdia de gua ingerida por um ser humano de 10 litros por semana, os
brasileiros bebem muito ou pouca gua? Como responderamos a esta questo? A resposta para
essas questes ser vista nessa unidade.
S VEZES, AS AMOSTRAS NO DO EXATAMENTE O RESULTADO CORRETO
Voc j viu como usar estimadores pontuais para estimar o valor exato da
mdia, varincia ou proporo da populao, mas a questo como ter
certeza de que sua estimativa est totalmente correta. Afinal de contas, suas
consideraes sobre a populao dependem de apenas uma amostra, e se
sua amostra fugir regra? Neste captulo, voc vai ver outra maneira de
estimar as estatsticas de uma populao, uma maneira que leva em
conta as incertezas. Pegue suas tabelas de probabilidade e vamos mostrarlhes cada detalhe dos intervalos de confiana.
O PROBLEMA DA PRECISO
Estimadores pontuais so a melhor estimativa que podemos dar para as estatsticas de uma
populao. Voc tomar uma amostra representativa dos dados e a usa para estimar estatsticas
importantes sobre a populao tais como: a mdia, a varincia e a proporo. O problema ao
deduzir estimadores pontuais que dependemos dos resultados de uma nica amostra para
obtermos uma estimativa bastante precisa.
459
Os estimadores pontuais so de grande valor, mas podem gerar pequenos erros. Como no
estamos trabalhando com a populao inteira, estamos apenas dando uma melhor estimativa. Se
a amostra que usamos for no-tendenciosa, provvel que a estimativa seja prxima ao
verdadeiro valor da populao. A questo at que ponto prximo prximo suficiente.
Em vez de dar um valor exato como estimativa para a mdia da populao, podemos especificar
alguns intervalos com uma estimativa. Por exemplo, poderamos dizer que esperamos que o
sabor da goma de mascar dure entre 55 e 65 minutos. Assim, continuamos tendo a impresso de
que o sabor dura por aproximadamente 1 hora, mas temos uma certa margem de erro.
A questo com achar esse intervalo? Tudo depende da confiana que voc deseja que seus
resultados tenham...
3. Conhecendo a Temtica
3.1. Estimao de Parmetros
H inmeras situaes reais em que se procura determinar valores para quantidades
desconhecidas como mdias e propores. Certamente, de interesse para muitos empresrios
saber a quantia mdia gasta por um turista em sua cidade; um produtor de televiso procura
sempre saber qual o ndice de audincia de determinados programas; um engenheiro de controle
de qualidade procura determinar a proporo de itens produzidos com defeito em uma linha de
produo.
A estimao consiste em determinar um valor amostral que substitua o respectivo valor real do
parmetro populacional desconhecido.
3.1.1. Conceitos Fundamentais
Para uma melhor compreenso dos temas mais importantes desta unidade, vamos definir
alguns conceitos fundamentais dentro da inferncia estatstica:
1 n
xi , onde
n i =1
x1, x2, ... , xn so n valores amostrais, um estimador que representa a mdia populacional
(parmetro).
Estimativa: um valor particular do estimador para uma dada amostra coletada. Assim,
por exemplo, para uma dada amostra, X = 3,9kg pode ser uma estimativa para o
verdadeiro peso mdio, desconhecido, de recm-nascidos do sexo feminino em certa
localidade.
[T1 = X 0 ; T2 = X + 0 ] = [ X 0 ] ,
onde 0 representa a semi-amplitude do intervalo de confiana, sendo chamado de Erro de
Preciso em relao a . Portanto, o objetivo encontrar 0, tal que:
P( X 0 < < X + 0 ) = 1 .
Em breve, entenderemos a necessidade destas duas ltimas afirmaes probabilsticas.
461
X =
1 n
2
xi , apresenta distribuio: X N , e Z = X N (0,1) .
n i =1
n
P( 0 < X < + 0 ) = 1
+ 0
0
P
<Z<
=1
/ n
/ n
0
0
<Z<
P
=1
/
n
n
P( Z / 2 < Z < + Z / 2 ) = 1
onde: Z / 2 =
/2
0
0
e Z / 2 =
.
/ n
/ n
(1 )
Z/2
Logo,
0 = Z / 2
/2
Z/2
A partir da expresso acima podemos tambm estimar, por exemplo, o tamanho da amostra (n)
quando 0, z e so conhecidos:
n = Z / 2
0
< < X + Z / 2
P X Z / 2
=1 .
n
n
Em outras palavras, isso significa que a probabilidade de que o verdadeiro valor de pertena ao
intervalo com grau de confiana igual a (1 ) :
; X + Z / 2
IC[ ; (1 )] = X Z / 2
n
n
Exemplo 5.1: Para estimar gasto mdio semanal no supermercado A, coletou-se uma amostra
aleatria de 16 consumidores, obtendo-se um gasto mdio amostral de X = US$30,00. Supondo
uma distribuio normal para a populao, com desvio padro = US$2,60, obtido de outros
462
estudos similares, calcule um intervalo de 95% de confiana para estimar o gasto mdio semanal
populacional no supermercado A.
Soluo: Dados: = 2,6; n = 16 e X = 30. Para = 5% z/2 = P( Z z / 2 ) = 1,96.
Logo, o intervalo de confiana ser, ento expresso por:
IC [; 95%] = 30 1,96
2,6
= [30 1,27] = [28,73; 31,27].
16
1%
5%
Z/2
2,57
1,96 1,64
10%
S2 =
(X
X )2
i =1
n 1
Agora, a estatstica:
T=
X
~ t ( n 1) ,
S/ n
T=
X
X
=
=Z .
S
S
n
n
Logo,
t ( n 1, / 2 ) = Z / 2
Substituindo Z / 2 = t( n 1, / 2 )
Z / 2 = t ( n 1, / 2 )
S
S
IC[ ; (1 )] = X t ( n 1, / 2 )
; X + t ( n 1, / 2 )
n
n
463
Logo,
0 = t( n 1, / 2 )
S
.
n
A partir da expresso acima podemos tambm estimar, por exemplo, o tamanho da amostra (n)
quando 0, Z e S so conhecidos.
S
n = t( n 1, / 2 )
0
Exemplo 5.2: Um fiscal de produtos alimentcios seleciona uma amostra aleatria de 16 pacotes
de lanche marca M nas prateleiras de um supermercado. Pesa o contedo de cada pacote,
encontrando um peso mdio X = 170 g e um desvio padro S = 5 g. O peso lquido indicado em
cada pacote 180 g. Verifique se um intervalo com 90% de confiana para o peso mdio lquido
verdadeiro abrange o peso lquido especificado na embalagem. Suponha distribuio normal para
a populao.
Soluo:
Dados: n = 16, X = 170 g e S = 5 g.
Para = 10% e n = 16 t( n 1; / 2 ) = t(15; 0, 05) = 1,753 , obtido da tabela da distribuio tStudent, pois a informao que dispomos no problema diz respeito ao desvio padro
amostral.
Logo, o intervalo de confiana para o peso mdio populacional ser denotado por:
IC [; 90%] = 170 1,753 5 = [170 2,19] = [167,81; 172,19].
16
464
Assim, podemos afirmar que com 99% de confiana, o intervalo [14,23 km/l; 17,77km/l]
contm o verdadeiro valor para a distncia percorrida pelo novo motor (em quilmetros)
com um litro de gasolina.
Exemplo 5.4: Se um pesquisador sabe que uma populao tem distribuio normal com desvio
padro =12. Considerando um nvel de confiana de 95%, encontre o tamanho de amostra
necessrio para que a mdia amostral no se afaste em mais de 2 unidades do verdadeiro valor
da mdia populacional.
Soluo:
Em nosso problema, observamos que o desvio padro populacional conhecido. Neste
caso, usamos a expresso a seguir para o clculo do tamanho de amostra:
Dados: = 12, 0 = 2 e que = 5% Z/2 = 1,96. Dessa forma,
2
12
= 1,96 139.
n = z / 2
0
2
1
p(1 p) .
1
X 1
X 1
E ( p ) = E = E ( X ) = np = p e Var ( p ) = Var = 2 Var ( X ) = 2 np (1 p ) =
n
n
n
n n
n n
n
Assim, Z =
p p
p(1 p)
n
N (0,1) .
0 = z / 2
p (1 p )
.
n
465
Note que a partir da expresso acima tambm podemos o tamanho da amostra (n) quando 0, Z
e p so conhecidos.
No entanto, na prtica p desconhecido, sendo substitudo pela proporo amostral p .
Tal substituio encontra justificativa no fato de que se n suficientemente grande para garantir a
aproximao para Normal, a estimativa deve ser razoavelmente prxima do valor real do
parmetro. Assim, o intervalo de confiana para p, ao nvel de confiana (1 ), dado por:
IC [ p; (1 )] = p z / 2
p (1 p )
; p + z / 2
n
p (1 p )
Exemplo 5.5: Para se avaliar a taxa de desemprego em uma cidade, coletou-se uma amostra
aleatria de 1000 habitantes em idade de trabalho e observou-se que 87 eram desempregados.
Estimar a percentagem de desempregados em toda a cidade (populao) atravs de um intervalo
de 95% de confiana.
Soluo:
Dados: n = 1000. A proporo amostral de desempregados dada por:
87
p =
= 0,087 . Logo, q = (1 p ) = 0,913. Para = 5% Z/2 = 1,96.
1000
O intervalo de confiana ser,
IC [p; 95%] =
(0,087 )(0,913)
0
,
087
1
,
96
z
1,96
n = / 2 p (1 p ) n =
(0,38)(0,62) 566 .
0,04
0
Como apenas 150 pessoas foram entrevistadas preliminarmente, a amostra no foi
suficiente. Sendo necessrio entrevistar mais (566 150) = 416 pessoas.
466
:: SAIBA MAIS... ::
NEM TUDO O QUE LHE DIZEM ABSOLUTAMENTE CERTO
O problema como saber quando o que lhe esto dizendo no certo. Testes de
hipteses so ferramentas que usam amostras para testar se provvel ou no que
afirmaes estatsticas sejam verdadeiras. Eles so uma forma de ponderar as
evidncias e testar se resultados extremos podem ser explicados por mera
coincidncia ou se existem foras ocultas em ao. Embarque nesse passeio no
prximo tpico e vamos mostrar como usar testes de hiptese para confirmar ou
descartar suas mais profundas suspeitas!
467
Deciso Correta
Erro do Tipo I ()
Erro do Tipo II ()
Deciso Correta
468
Estatstica do Teste
A deciso de rejeitar ou no a hiptese nula (H0) baseada nos dados amostrais, que so
usados para calcular o valor da Estatstica de Teste e que servir de referncia para a tomada da
deciso. Para isso, divide-se a curva da distribuio amostral da estatstica em duas regies, uma
chamada Regio Crtica (ou Regio de Rejeio de H0), e a outra Regio de No Rejeio de
H0. Temos, ento, a seguinte Regra de Deciso do teste:
Se o valor calculado da estatstica do teste pertencer regio
crtica, rejeita-se H0 em favor da hiptese alternativa; caso
contrrio, H0 no ser rejeitada em relao hiptese alternativa.
Outras definies importantes, necessrias na formulao de um problema de Testes de
Hipteses so:
A escolha entre usar um teste unilateral e um teste bilateral determinada pelos objetivos do
problema, no qual se deseja verificar uma afirmao a cerca do parmetro populacional.
3.3.3. Fases na Realizao de um Teste de Hipteses
Formular as hipteses nula (H0) e alternativa (H1);
Esta a afirmao que vamos testar.
Decidir qual estatstica de teste ser usada para julgar a hiptese nula;
469
O primeiro passo num Teste de Hipteses consiste em formular a hiptese a ser testada.
No Quadro 1, podemos observar que para cada possvel hiptese existe uma regio crtica e regra
de deciso associada. No caso do teste de hipteses para mdia populacional, supondo a
varincia populacional conhecida, utilizamos a seguinte estatstica do teste:
ZC =
X 0
Note que a estatstica calculada com base nas informaes contidas na amostra.
O prximo passo consiste em fixar o nvel de significncia do teste (). A seguir,
apresentamos os valores mais usados para Z e Z/2.
1%
5%
10%
Z
Z/2
2,33
2,57
1,64
1,96
1,28
1,64
470
Quadro 2: Resumo das Hipteses, Regies Crticas e Regras de Deciso para a Mdia Populacional,
considerando 2 conhecido.
Hipteses
Regio Crtica
(sombreada)
Regra de Deciso
(Rejeitar H0)
H0: = 0
H1: 0
Zc -Z/2 ou Zc Z/2
H0: = 0 (*)
H1: < 0
Zc -Z
H0: = 0 (**)
H1: > 0
Z c Z
(*) Por simplicidade, excluiu-se a possibilidade 0 na hiptese nula H0, com base no
conhecimento de que tal fato levaria mesma deciso que a aceitao simples de H0: = 0.
(**) Por simplicidade, excluiu-se a possibilidade 0 na hiptese nula H0, com base no conhecimento
de que tal fato levaria mesma deciso que a aceitao simples de H0: = 0.
Exemplo 5.7: O gerente de uma indstria de carnes enlatadas tem estabelecido a seguinte
especificao: um novilho com 12 meses de vida resulta numa mdia de 250 kg de carne. A
experincia passada indica que, mesmo com uma mudana na mdia, o desvio padro permanece
ligeiramente constante, em = 18 kg. Para determinar se a especificao est sendo observada, o
gerente seleciona uma amostra aleatria com 100 novilhos e obteve uma mdia X = 253 kg de carne.
Realize um teste de hiptese para verificar se houve mudana na especificao, a um nvel de
significncia de 5%.
471
Soluo:
H0: = 250 kg versus H1: 250 kg (a especificao no est sendo observada)
Temos que = 18 kg; n = 100, X = 253 kg. Como conhecido vamos fazer uso da
varivel Normal, Z.
= 5%.
Dessa forma, a estatstica do teste dada:
2,5%
1,96
95%
Zc =
2,5%
253 250
= 1,67
18
100
0
1,96
1,67
Deciso: Como Z/2 < Zc < Z/2 No existem evidncias para rejeitar H0. Logo, com
base nos dados amostrais e com 5% de significncia no podemos rejeitar a hiptese H0, ou
seja, no existe evidncia para afirmar que a especificao est sendo violada.
Caso 02: 2 NO Conhecida
S2 =
(X
X )2
i =1
n 1
Dessa forma, a estatstica do teste para mdia populacional quando 2 desconhecida ser
expressa por:
TC =
X 0
S
O prximo passo consiste em fixar o nvel de significncia do teste (). A seguir, apresentamos as
regies crticas e regras de deciso para as respectivas hipteses.
472
Quadro 3: Resumo das Hipteses, Regies Crticas e Regras de Deciso para a Mdia
Populacional, considerando 2 desconhecido.
Hipteses
Regio Crtica
(sombreada)
Regra de Deciso
(Rejeitar H0)
H0: = 0
H1: 0
Tc -t(n-1,/2) ou
Tc t(n-1,/2)
H0: = 0 (*)
H1: < 0
Tc -t(n-1,)
H0: = 0 (**)
H1: > 0
Tc t(n-1,)
(*) Por simplicidade, excluiu-se a possibilidade 0 na hiptese nula H0, com base no
conhecimento de que tal fato levaria mesma deciso que a aceitao simples de H0: = 0.
(**) Por simplicidade, excluiu-se a possibilidade 0 na hiptese nula H0, com base no
conhecimento de que tal fato levaria mesma deciso que a aceitao simples de H0: = 0.
Exemplo 5.8: O tempo mdio necessrio para completar uma tarefa era de 15 minutos. Obtm-se
uma amostra aleatria de nove indivduos e, durante o perodo de teste, seus tempos (X) para
concluir a tarefa foram 11, 12, 15, 10, 12, 14, 15, 13 e 15. Assumindo que estes dados vm de
uma distribuio normal, teste a hiptese de que houve alterao no tempo mdio para completar
a tarefa. Use um nvel de 5% de significncia.
473
Soluo:
H0: = 15min versus H1: 15min (houve alterao no tempo mdio)
Com base nas informaes amostrais, temos que n = 9; X = 13min e S = 1,871 min.
Como o desvio-padro da populao desconhecido, , a varivel usada para a estatstica
de teste a t-Student com (n 1) graus de liberdade.
= 5%. Sendo n = 9, ser t(n 1; /2) = t(8; 0,025) = 2,306 (obtido da tabela da distribuio tStudent).
Dessa forma, a estatstica do teste dada:
2,5%
95%
Tc =
2,5%
13 15
= 3,207
1,871
9
2,306
Dessa forma, sob a hiptese H0: p = p0, a estatstica do teste para a proporo
populacional p ser expressa por:
p p0
ZC =
p0 (1 p0 )
n
ZC ~ N(0; 1). Aps fixar o nvel de significncia do teste (), apresentamos a seguir as regies
crticas e regras de deciso para as respectivas hipteses.
474
Quadro 4: Resumo das Hipteses, Regies Crticas e Regras de Deciso para a Proporo
Populacional p.
Hipteses
Regio Crtica
(sombreada)
Regra de Deciso
(Rejeitar H0)
H0: p = p0
H1: p p0
Zc -Z/2 ou Zc Z/2
H0: p = p0 (*)
H1: p < p0
Zc -Z
H0: p = p0 (**)
H1: p > p0
Zc Z
(*) Por simplicidade, excluiu-se a possibilidade p p0 na hiptese nula H0, com base no
conhecimento de que tal fato levaria mesma deciso que a aceitao simples de H0: p = p0.
(**) Por simplicidade, excluiu-se a possibilidade p p0 na hiptese nula H0, com base no
conhecimento de que tal fato levaria mesma deciso que a aceitao simples de H0: p = p0.
Exemplo 5.9: Afirma-se que em um alqueire de mas, 10% esto estragadas. De uma amostra
aleatria de 150 mas examinadas, 30 estavam estragadas. O que voc conclui sobre a
proporo de mas estragadas em um alqueire a um nvel de 5% de significncia?
475
Soluo:
H0: p = 0,10 versus H1: p 0,10.
Com base nas informaes amostrais, temos que n = 150 e p = 30/150 = 0,20. No caso
da proporo use a varivel Z.
= 5%.
2,5%
1,96
2,5%
Zc =
1,96
4,08
0,2 0,1
= 4,08
( 0,1).( 0,9 )
150
Deciso: Como ZC > Z/2 Existem evidncias para rejeitar H0. Logo, com base nos
dados amostrais e ao nvel de 5% de significncia, podemos concluir que a porcentagem de
mas estragadas diferente de 10%.
Exemplo 5.10: De registros de vendas passadas sabe-se que 30% dos consumidores compram a
pasta dental C. Uma nova propaganda desse produto feita e, para testar sua eficcia, de uma
amostra aleatria de 1000 consumidores que viram a propaganda, 334 responderam que
compram a pasta dental C. Isso indica que a nova propaganda foi bem sucedida? Use um nvel de
5% de significncia para testar se a nova propaganda aumentou a proporo de consumidores da
pasta dental C.
Soluo:
H0: p = 0,30 versus H1: p > 0,30 (a nova propaganda aumentou as vendas da pasta C).
Com base nas informaes amostrais, temos que n = 1000 e p = 334/1000 = 0,334. No
caso da proporo use a varivel Z.
= 5%.
5%
1,64
Zc =
0,334 0,300
= 2,35
( 0,3).( 0,7 )
1000
Deciso: Como ZC > Z Existem evidncias para rejeitar H0. Logo, com base nos dados
amostrais e ao nvel de 5% de significncia, podemos concluir a nova propaganda aumentou
a proporo de consumidores que compram a pasta dental C.
476
REFERNCIAS
COSTA NETO, P.L., Estatstica, Edgard Blucher, So Paulo, 1977.
FONSECA, J.S., MARTINS, G.A. & TOLEDO, G.L., Estatstica Aplicada, Editora Atlas, 2
ed., So Paulo, 1985.
GRIFFITHS, D. Use a Cabea. Estatstica, Editora Alta Books, Rio de Janeiro, 2009.
MEYER, P.L., Probabilidade: Aplicaes Estatstica, Livros Tcnicos e Cientficos,
Editora AS, Rio de Janeiro, 1983.
TRIOLA, M.F, Introduo Estatstica, Livros Tcnicos e Cientficos, 7 ed,, Rio de
Janeiro, 1999.
VIEIRA, S. Introduo Bioestatstica, Editora Campus, 1999.
477