Professional Documents
Culture Documents
I INTRODUO
1.DEFINIO
A Estatstica uma cincia de mltiplas aplicaes e de fundamental importncia no campo
da investigao cientfica, sendo de utilizao cada vez mais acentuada em qualquer
atividade profissional. Ento, razovel que os profissionais de diversas reas adquiram
um mnimo de conhecimento tcnico sobre estatstica que possibilitem a compreenso de
termos como: variabilidade, regresso, correlao, significncia, e que aparecem com
frequncia no nosso cotidiano e em artigos de publicaes especializadas.
A Estatstica um conjunto de mtodos destinados a coleta, organizao, resumo,
apresentao e anlise de dados de observao, bem como a tomada de decises
razoveis baseadas em tais anlises. Ela pode ser dividida em dois campos:
Estatstica descritiva: trata da coleta, da organizao, classificao,
apresentao e descrio dos dados de observao. Se refere a maneira de apresentar um
conjunto de dados em tabelas e grficos e a maneira de resumir, atravs de certas
medidas, as informaes contidas nestes dados.
Estatstica inferencial: visa tirar concluses sobre a populao a partir de
amostras. Se refere a maneira de estabelecer concluses para toda uma populao quando
se observar apenas parte desta populao.
2. CONCEITOS BSICOS
POPULAO X AMOSTRA
Populao (N): conjunto de todos os elementos relativos a um determinado fenmeno
que possuem pelo menos uma caracterstica em comum, podendo ser finita (apresenta um
nmero limitado de observaes, que passvel de contagem) ou infinita (apresenta um
nmero ilimitado de observaes que impossvel de contar e geralmente est associada
a processos).
Amostra (n): um subconjunto da populao. A amostra deve ser selecionada seguindo
certas regras e para ser representativa, de modo que ela represente todas as
caractersticas da populao como se fosse uma fotografia desta.
PARMETROS X ESTATSTICA
Parmetros: so medidas obtidas quando se investiga a populao em sua totalidade,
neste caso impossvel fazer inferncias pois toda a populao foi investigada.
Estatsticas ou Estimadores: so medidas obtidas da amostra. Torna-se possvel neste
caso, utilizarmos as teorias de inferncias para que possamos fazer concluses sobre a
populao.
II TESTES DE HIPTESES
1.INTRODUO
Na teoria de deciso estatstica, os testes de hipteses assumem uma importncia
fundamental, j que estes permitem nos dizer, por exemplo, se duas populaes so de
fato iguais ou diferentes, utilizando para isso amostras destas populaes. Desta forma, a
tomada de deciso de um pesquisador, deve estar baseada na anlise dos dados a partir
de um teste de hipteses.
Ento voc pode definir as hipteses a ser testado, retirar amostras das populaes a
ser estudado, calcular as estatsticas delas e, por fim, determinar o grau de aceitao de
hipteses baseadas se uma determinada hiptese ser vlida ou no.
Para voc decidir se uma hiptese verdadeira ou falsa, ou seja, se ela deve ser aceita
ou rejeitada, considerando uma determinada amostra, precisamos seguir uma srie de
passos:
I) Formular as hipteses e
0 : hiptese nula a hiptese inicial.
1 : hiptese alternativa a hiptese contrria a 0 .
Observe que as hipteses 0 e 1 so hipteses mutuamente excludentes, ou seja,
aceitando-se uma das hipteses como sendo verdadeira, a outra, automaticamente, ser
rejeitada.
Ao testarmos uma 0 , chegamos a uma concluso: aceit-la ou rejeit-la. Desse modo
podemos cometer dois tipos de erros:
Erro Tipo I: consiste em rejeitar 0 , quando ela verdadeira. Pode ser limitado pela
escolha de .
Erro Tipo II: consiste em aceitar 0 , quando ela falsa. a potncia do teste.
4
/2
1-
/2
Neste tipo de teste, se aceita H0 se o valor calculado com base na amostra, estiver entre
os dois valores tabelados, como na figura acima.
5
1-
Neste tipo de teste, se aceita H0 se o valor calculado com base na amostra for menor que
o valor tabela, como na figura acima.
Teste unilateral esquerda
H0 : = nmero
H1 : <
1-
Neste tipo de teste, se aceita H0 se o valor calculado com base na amostra for maior que
o valor tabela, como na figura acima.
V) Tomar a deciso
Para tomar a deciso, voc deve calcular a estimativa do teste estatstico que ser utilizado
para rejeitar ou no H0 .
2. TESTES NO PARAMTRICOS
A Estatstica no-paramtrica no exige suposies quanto a distribuio da
populao da qual se tenha retirado amostras para anlise. Vamos estudar agora um teste
no-paramtrico, assim chamado por no depender dos parmetros populacionais nem
de suas respectivas estimativas.
Para a realizao desse teste no-paramtrico ns utilizaremos uma nova distribuio
estatstica chamada Qui-Quadrado, cuja medida baseia-se no grau de concordncia entre
as frequncias observadas e as frequncias esperadas de acordo com as regras de
probabilidade.
Suponha um experimento realizado vezes, onde se observou um conjunto
1 , 2 , , com as respectivas frequncias 1 , 2 , , . No entanto, de acordo com as
regras de probabilidade deveriam apresentar as seguintes frequncias tericas ou
esperadas 1 , 2 , , .
Exemplo 1: Lanamento de um dado 60 vezes. O resultado deste experimento aparece na
tabela a seguir.
(1 1 )2 (2 2 )2
( )2
( )
2
=
=
+
++
1
2
a) Enunciar as hipteses H0 e H1 .
H1 : fo fe
c) Estatstica calculada
= =1
( )2
2
2
d) Estatstica Tabelada:
= ,
2
2
e) Comparar
com
e concluir:
f) Concluso
Exemplo 2: O nmero de livros emprestados por uma biblioteca durante certa semana est
a seguir. Teste a hiptese que o nmero de livros emprestados no depende do dia da
semana, com = 1%.
10
11
EXERCCIOS PROPOSTOS
1. As diferenas entre os sonhos das pessoas dos sexos masculinos e femininos foram documentadas
(Winget & Kramer, 1979). Um pesquisador, atravs de uma amostra, analisou essa diferena entre os
sonhos de homens e mulheres. Cada sonho julgado de acordo com as seguintes categorias, referentes a
agressividade; baixa, mdia ou alta. As frequncias observadas esto mostradas na tabela abaixo:
Baixa agressividade
Mdia agressividade
Alta agressividade
Mulheres
34
18
Homens
33
20
Verificar se h alguma relao entre o gnero (masc./fem.) e a agressividade dos sonhos. Adotar o nvel
= ,
de significncia de 1%.
rejeita-se H0
2. Uma bibliotecria fez uma pesquisa, durante uma certa semana, sobre o nmero de livros retirado pelos
estudantes. Testar a hiptese de que nmero de livros emprestados no depende do dia da semana, com
nvel de significncia de 1%.
Dias da semana
Seg
Ter
Qua
Qui
Sex
No de livros emprestados
100
138 130
152
118
= ,
Aceita-se H0
3. Um pesquisador deseja saber se existe alguma faixa etria mais propensa ao risco de morte pela ao
da gripe (influenza). Foi colhida uma amostra de 80 pessoas que morreram devido a esse tipo de problema.
Abaixo de 15 anos
De 15 a 50 anos
10 casos
Acima de 50 anos
20 casos
50 casos
No local onde essa amostra foi selecionada, os valores padres para esse tipo de morte so; 15% da
populao com menos que 15 anos; 35% entre 15 e 50 anos e 50% acima de 50 anos. O pesquisador pode,
ao nvel de 5%, concluir que o risco de morte est associado a faixa etria? = , Aceita-se H0
4. Um psiclogo submeteu um grupo de pacientes a um teste, ministrando sonfero a um grupo e plulas
de farinha (placebo) a outro grupo. Perguntado aos pacientes se o medicamento ajudou ou no a dormir
melhor, as respostas foram as seguintes:
Plulas
Indiferente
Sonfero
32
15
23
Placebo
35
20
30
Testar, ao nvel de 5%, a hiptese de no haver diferena entre o fato do doente tomar sonfero e dormir
melhor.
= ,
Aceita-se H0
12
13
14
H0 : p = p0
H1 : p p0
p > p0
p < p0
0
.
0 0
onde
e) Concluso
16
Exemplo 2: Para testar a alegao de uma nutricionista de que pelo menos 75% das
crianas com menos de seis anos de idade de certo estado tem dietas deficientes em
protenas, um levantamento amostral revelou que 206 de 300 crianas com menos de seis
anos daquele estado tem dietas deficientes em protenas. Teste a hiptese nula = 0,75
contra a hiptese alternativa < 0,75 ao nvel de 0,01 de significncia.
17
Exerccios propostos
1. Um agente de viagem alega que dentre todas as pessoas que solicitam informaes sobre cruzeiros
transatlnticos, no mximo 5% delas realmente faz um desses cruzeiros dentro de um ano. Se, numa
amostra aleatria de 16 pessoas que solicitaram informaes sobre tais cruzeiros, 3 realmente fizeram
um cruzeiro, isso evidncia suficiente para rejeitar a alegao da agente de viagens = 0,05 contra a
alternativa > 0,05 ao nvel de 0,01 de significncia?
2. Um cientista social alega que, entre pessoas residindo em reas urbanas, 50% so contra a pena de
morte (enquanto que os outros so a favor ou indecisos). Teste a hiptese nula = 0,50 contra a hiptese
alternativa 0,05 ao nvel de 0,10 de significncia se, num amostra aleatria de = 20 pessoas
residindo em reas urbanas, 14 so contra a pena de morte.
3. Um processo deveria produzir bancadas com 0,85 m de altura. O engenheiro desconfia que as bancadas
que esto sendo produzidas so diferentes que o especificado. Uma amostra de 8 valores foi coletada e
indicou = 0,87. Sabendo que o desvio padro 0,010, teste a hiptese do engenheiro usando um nvel
de significncia de 5%
zcal=5,66
rejeita-se H0
4. Um empresrio desconfia que o tempo mdio de espera para atendimento de seus clientes superior
a 20 minutos. Para testar essa hiptese ele entrevistou 20 pessoas e questionou quanto tempo demorou
para ser atendido. O resultado dessa pesquisa aparece a seguir. Teste ao nvel de significncia de 5% se o
tempo de espera para atendimento superior a 20 minutos.
S=1,4
tcal=5,75
rejeita-se H0
5. Uma oceangrafa, com base numa amostra aleatria de tamanho = 35 e ao nvel 0,05 de
significncia, quer testar se a profundidade mdia do oceano numa determinada rea de 72,4 metros,
conforme registrado. O que ela decidir se obtiver = 73,2 metros e se puder supor, usando irformaes
de estudos anteriores anlogos que = 2,1 metros?
6. A safra de alfafa de uma amostra aleatria de seis lotes de teste dada por 1,4; 1,6; 0,9; 1,9; 2,2 1,2
tonelada por acre. Teste ao nvel 0,05 de significncia, se isso corrobora a alegao de que a safra mdia
para esse tipo de alfafa de 1,5 toneladas por acre.
18
4. EXERCCIOS DE FIXAO
1. A Debug Company vende um repelente de insetos que alega ser eficiente pelo prazo de
400 horas no mnimo. Uma anlise de 90 itens aleatoriamente inspecionados acusou uma
mdia de eficincia de 380 horas.
a) Teste a afirmativa da companhia, contra a alternativa que a durao inferior a 400
horas, ao nvel de 1%, seu desvio padro de 60 horas.
b) Repita o teste, considerando um desvio padro populacional de 90 horas.
3. Uma pesquisa feita alega que 15% das pessoas de uma determinada regio sofrem de
cegueira aos 70 anos. Numa amostra aleatria de 60 pessoas acima de 70 anos constatouse que 12 pessoas eram cegas. Teste a alegao para = 5% contra p >15%.
4. Uma experincia tem mostrado que 40% dos estudantes de uma Universidade reprovam
em pelo menos 5 disciplinas cursada na faculdade. Se 40 de 90 estudantes fossem
reprovados em mais de 5 disciplinas, o que poderamos concluir quanto a proporo
populacional, usando = 1%.
19
20
21
(comprimento x altura em cm2) dedicados sua linha de produtos e (2) total das vendas
dos produtos, em reais, no ltimo ms. Os dados so apresentados na tabela abaixo.
Tabela Vendas x espao dedicado aos produtos (em cm2).
Local
Espao
Vendas
340
71
230
65
405
83
325
74
280
67
195
56
265
57
300
78
350
84
10
310
65
Pela observao da tabela no fcil perceber o tipo de relacionamento que possa existir
entre as duas variveis. Para ter uma ideia melhor, as variveis so colocadas no que
denominado de diagrama de disperso. Uma das variveis (X) representada no eixo
horizontal e a outra varivel (Y) no eixo vertical.
Uma olhada rpida no diagrama de disperso mostra a existncia de um relacionamento
entre as variveis, com altos valores de uma das variveis associados a altos valores da
outra varivel. Se no houvesse relacionamento entre elas, os pontos estariam distribudos
ao acaso no grfico sem mostrarem alguma tendncia.
23
24
ordinal ou quando uma das variveis manipulada experimentalmente, pois neste caso, a
escolha dos valores experimentais vai influenciar o valor de r obtido.
Uma terceira hiptese que as duas variveis tenham uma distribuio conjunta normal
bivariada. Isto equivalente a dizer que para cada x dado a varivel y normalmente
distribuda. Suponha-se que existam apenas duas variveis X e Y. Uma amostra da varivel
X, assumindo os valores particulares X1 , X2, ..., Xn e uma amostra da varivel Y
assumindo os valores particulares Y1, Y2, ..., Yn so obtidas e suponha-se ainda que o objetivo
saber se existe algum tipo de relacionamento linear entre estas duas variveis. Isto
poder ser medido pelo coeficiente de correlao linear de Pearson que fornece o grau de
relacionamento linear entre duas variveis.
1.5. DEFINIO
Na populao o coeficiente de correlao representado por e na amostra por r.
Assim dadas duas amostras, uma da varivel X e outra da varivel Y, o coeficiente de
correlao amostral poder ser calculado atravs da seguinte expresso:
=
Onde =
; = 2
( )2
e = 2
( )2
1.6. PROPRIEDADES DE r
As propriedades mais importantes do coeficiente de correlao so:
Intervalo de variao vai de -1 a +1.
Coeficiente de correlao uma medida adimensional, isto , ele independente das
unidades de medida das variveis X e Y.
25
Quanto mais prximo de +1 for r, maior o grau de relacionamento linear positivo entre
X e Y, ou seja, se X varia em uma direo Y variar na mesma direo.
Quanto mais prximo de -1 for r, maior o grau de relacionamento linear negativo entre
X e Y, isto , se X varia em um sentido Y variar no sentido inverso.
Quanto mais prximo de zero estiver r menor ser o relacionamento linear entre X e
Y. Um valor igual a zero, indicar ausncia apenas de relacionamento linear.
2 = ( ) , 0 2 1
Quanto mais prximo da unidade o R estiver, melhor a qualidade do ajuste. O seu valor
fornece a proporo da varivel Y explicada pela varivel X atravs da funo ajustada.
Matemtica 6
10
Estatstica
10
EXERCCIOS
1. Vamos supor que 5 pessoas tenham sido questionadas a respeito das seguintes
perguntas:
a) Durante quantos anos voc frequentou a escolar regularmente?
b) Quantos livros voc tem em sua biblioteca particular?
As respostas foram apresentadas na tabela abaixo. Com base nestes dados verifique se
existe correlao entre os anos que estas pessoas frequentaram a escolar e o nmero de
livros que possuem em sua biblioteca.
Sujeito
Frequncia a escola 5
10
12
15
Nmero de livros
30
45
50
75
10
Homens
10
Mulheres
10
27
2 REGRESSO
2.1 INTRODUO
Um dos problemas frequentemente encontrados na prtica descrever e predizer
fenmenos observados. Isso pode ser resolvido atravs da construo de um modelo
matemtico que relacione as variveis envolvidas no fenmeno podendo este modelo ser
utilizado para fins de predio.
Suponha que Y (dependente) seja uma varivel que nos interessa estudar e prever seu
comportamento. esperado que os valores da varivel X (independente) sofram influncia
dos valores de um nmero finito de variveis 1 , 2 , 3 , , (independentes) e que exita
uma funo f que expresse tal dependncia.
fcil perceber que se torna impraticvel a utilizao de todas as n variveis, ou por
desconhecimento de algumas, ou pela dificuldade de mensurao e tratamento de outras.
30
790
780
770
760
750
Velocidade (km/h)
280
284
291
295
301
31
2.7 EXERCCIOS
1. Uma empresa, estudando como varia a procura de certo produto em funo de preo
de venda, obteve as informaes contidas a tabela. Com esses dados:
Preo de venda (x)
250
275
300
325
350
Procura (y)
275
213
152
85
25
32