You are on page 1of 85

AT

C837 Costa, Suely de Souza


Estatstica bsica / Suely de Souza Costa, Jos Cardoso Neto, Snia
Arajo do Nascimento. --- Manaus : [s.n.], 2012.
85 p. : il. color.

Elaborao Projeto Fronteiras: Alto Rio Negro; apoio FINEP,
Financiadora de Estudos e Projetos.
Bibliografia: p. 81-82.
ISBN:

1. Estatstica Estudo e ensino. I. Cardoso Neto, Jos.
II. Nascimento, Snia Arajo. III. Ttulo.



CDD 19. ed. 519.5
INSTITUTO NACIONAL DE PESQUISAS DA AMAZNIA
Inpa
PROJETO FRONTEIRA: ALTO RIO NEGRO
SUBPROJETO:
IMPLANTAO DE UM BANCO DE DADOS AMBIENTAIS E
DE UMA BIBLIOTECA EM SO GABRIEL DA CACHOEIRA,
NO ALTO RIO NEGRO, AMAZONAS.
ESTATSTICA BSICA
Autores
SUELY DE SOUZA COSTA
JOS CARDOSO NETO
SONIA ARAUJO DO NASCIMENTO
Manaus
2012
Presidncia da Republica
Ministrio Cincia Tecnologia
Instituto Nacional de Pesquisas da Amaznia Inpa
Projeto Fronteira: Alto Rio Negro
Wanderli Pedro Tadei, Dr.
Coordenador
Lcia K. O. Yuyama Dra.
Sub-coordenadora
Suely de Souza Costa Dra. Engenharia de Produo
e Coordenadora do Subprojeto Implementao do banco de dados ambientais e de
uma biblioteca em So Gabriel da Cachoeira.
ngela Nascimento dos Santos Panzu, Especialista em Memria Social e Docu-
mento e em Documentao e Informao, Bibliotecria e Orientadora.
Jos Cardoso Neto, Dr. em Estatstica e Professor da UFAM.
Sonia Arajo Nascimento, Esp. em Estatstica Industrial e Professora da UEA.
Silene da Mota Coelho, Especialista em Informtica na Educao.
Prlogo
Este livro prope disponibilizar as ferramentas bsicas e aplica-
es da estatstica para um pblico que precisa ambientar-se com est ma-
tria num curto espao de tempo. Este trabalho fruto da demanda de
So Gabriel da Cachoeira, e vem dar continuidade nos dois livros s desen-
volvidos anteriormente, para o ensino distncia para outros municpios
do Estado do Amazonas.
Procurou-se apresentar o contedo de forma fcil e dinmica.
Exemplos e exerccios prticos so usados para sedimentar o aprendizado
e, ao mesmo tempo, reduzir as fronteiras de acesso linguagem estatstica,
essencial para apoio tomada de deciso em diferentes reas do conheci-
mento.
Nofnaldeumcaminho,hsempremuitoagradecerquelesque,
de uma forma ou de outra, contriburam para a concluso deste trabalho.
Agradecemos aos nossos alunos que participaram direta ou indire-
tamente dos cursos ministrados em diversos momentos, nas salas de aula
presenciais e ensino distncia, tornando o projeto pedaggico realidade.
Entre os amigos que com estmulo nos apoiaram no cumprimento dessa
trajetria, expressamos gratido equipe do no sub-Projeto Fronteira, e
emespecial,oapoiofnanceirodaFinepaoProjetoFronteira.
7
SUMRIO
CAPTULO 1 CONCEITOS FUNDAMENTAIS......................13
1.1 Estatstica E sua importncia...............................................13
1.2 populao E amostra............................................................14
1.3 alguns tpicos importantEs na sElEo da amostra......15
1.3.1 Identifcao dos objetivos da pesquisa e popula-
o......................................................................................................15
1.3.2 Coleta dos dados.................................................................15
1.3.3 Planejamento e Seleo da amostra....................................16
1.3.4 critrios dE incluso E Excluso dos ElEmEntos da am
ostra.......................................................................................................16
1.3.5 Quais as tcnicas para sElEo da amostra...................16
1.3.6 Plano de Amostragem........................................................18
1.3.7 Seleo de Amostra............................................................20
1.4 amostragEm alEatria simplEs..........................................21
1.4.1 amostragEm Estratificada...............................................21
1.4.2 amostragEm sistEmtica....................................................21
1.5 dEfinio E classificao dE varivEis..............................23
1.5.1 Varivel Qualitativa.............................................................24
1.5.2 Varivel Quantitativa...........................................................24
1.6 colEta dE dados.....................................................................25
8
1.6.1 fontEs dE dados..............................................................25
1.6.2 construo dE instrumEnto dE pEsQuisa ...................26
1.6.3 amostra piloto ou pr-tEstE........................................27
1.6.4 rEcursos complEmEntarEs ...........................................27
CAPTULO 2 ORGANIZAO DE DADOS....................31
2.1 aprEsEntao dE dados Em tabElas...........................31
2.2 componEntEs das tabElas...............................................31
2.3 tabElas dE dupla Entrada............................................32
2.4 tabElas dE distribuio dE frEQncias.....................33
2.5 tabEla dE distribuio dE frEQncia pontual........34
2.6 tabElas dE distribuio dE frEQncias Em classEs..35
2.7 construo dE uma tabEla dE distribuio dE
frEQncia Em classEs..................................................................35
2.8 tipos dE frEQncias.......................................................38
2.9 mEdidas dE posio para dados agrupados................39
2.9.1 Mdia aritmtica (
X
) para dados agrupados.............39
2.9.2 Mediana -
d
M
..............................................................41
2.9.3 Moda -
o
M
...................................................................44
2.10 mEdidas dE dispErso ou variabilidadE......................46
2.10.1 Amplitude total........................................................47
2.10.2 varincia (
2
S
).......................................................48
2.10.3 dEsvio padro ( S
).....................................................49
8 9
2.11 mEdidas dE dispErso rElativa......................................51
2.12 coEficiEntE dE variao dE pEarson - (%) CV
.........51
CAPTULO 3 CORRELAO............................................59
3.1 diagrama dE dispErso...................................................59
3.2 corrElao linEar............................................................61
3.3 como sE mEdE corrElao linEar?................................62
3.4 tEstE dE significncia sobrE r
......................................63
CAPTULO 4 REGRESSO LINEAR SIMPLES..............67
4.1 introduo.........................................................................67
4.2 modElo Estatstico..........................................................67
4.3 o mtodo dos mnimos Quadrados..............................68
4.4 notao bsica..................................................................68
4.5 rEta dE mnimos Quadrados..........................................68
4.6 anlisE dE varincia.......................................................70
4.7 como Encontrar as somas dE Quadrados?...................71
4.8 como Encontrar os Quadrados mdios?......................72
4.9 o tEstE f.............................................................................73
4.10 coEficiEntE dE dEtErminao.......................................74
4.11 infErncia sobrE os parmEtros.....................................75
4.12 obsErvaEs sobrE o modElo:.........................................76
4.13 anlisE dos rEsduos........................................................77
10
REFERNCIAS..............................................................81
ANEXO...........................................................................83
TABELA DE ESTATSTICA A - DISTRIBUIO NOR-
MAL PADRO - ( ) P Z z p =
..............................................83
TABELA ESTATSTICA B - DISTRIBUIO T DE
STUDENT P(T > T)= ..............................................84
TABELA ESTATSTICA C - DISTRIBUIO F - P(F
> F; N,D) = 0.05..............................................................85
LISTA DE TABELAS
Tabela 1 Nmero de famlias nos bairros mais populosos de
uma cidade X.
Tabela 2. Populao por bairro, na cidade de So Gabriel da
Cachoeira, no ano de 2003.
Tabela 3 Nascidos vivos registrados por sexo e o ano de regis-
tro, 1988.
Tabela 4 Nmero de domiclios por bairros e regio de nasci-
mento do responsvel em So Gabriel da Cachoeira/AM, 2003.
Tabela 5 Nveis de escolaridade da Empresa X, no Polo Indus-
trial de Manaus, 2010.
Tabela 6 Nascidos vivos segundo o peso ao nascer, em quilo-
gramas.
Tabela7Nmerodefamliascomflhosdosexomasculino
Tabela 8 Estatura mdia de crianas em uma creche.
10 11
Tabela 9 Nmero de banheiros por domiclios
Tabela 10 Crianas e adolescentes em uma escola
Tabela 11 Distribuio das estaturas das crianas.
Tabela 12 A estatura modal conforme a tabela a seguir.
Tabela 13 Dados esto agrupados sem intervalos de
classe
Tabela 14 Dados de estatura (em cm) agrupados em
intervalos de classe ...............................................................
Tabela 15 Quantidades de nicotina e alcatro em 12
marcas de cigarros.
Tabela 16 Regra de deciso sob a hiptese nula
Tabela 17 Clculos para anlise de regresso: Nicotinas
(Y) e Alcatro (X) em mg.
Tabela 18 Anlise de Varincia ANOVA
Tabela 19 Tabela de Anlise de Varincia
Tabela 20 Anlise dos resduos, em funo da estimao
da nicotina e o valor observado.
LISTA DE QUADROS
Quadro 1 Quadro Retirado da Tabela Normal Padro
(Tabela C).
Quadro 2 Dados brutos da varivel peso de crianas
ao nascer (kg).
Quadro 3 Dados em ordem crescente da varivel peso
de crianas ao nascer (kg)
12
Quadro 4 Qual a temperatura mais comum medida
no ms.
Quadro 5 Estaturas e pesos de um grupo de indiv-
duos.
Quadro 6. Nmero de casas por quarteiro
Quadro7Estimaodoscoefcientesderegresso.
LISTA DE FIGURAS
Figura 1 Diagrama de disperso da quantidade de ni-
cotina e alcatro em cigarros.
Figura 2 Representao da correlao positiva.
Figura 3 Representao da correlao negativa
Figura 4 Representao da reta de regresso e dos
pontos observados.
Figura 5 Representao do resduo em funo dos da-
dos ajustados.
12 13
Captulo 1 Conceitos fundamentais
1.1 Estatstica e sua importncia
Durante muito tempo, a Estatstica foi vista como uma simples tc-
nica,quepodiaproporcionaraohomemapossibilidadedeproduzirgrf-
cos e tabelas. Posteriormente, a estatstica passou a ser um procedimento,
que servia razo, na teoria dos jogos. Atualmente, no mundo contempo-
rneo, passou a se constituir numa metodologia til no s para descrever
e analisar os fenmenos, mas, principalmente, para prever acontecimentos.
Paratanto,aEstatstica,atravsdetcnicasespecfcas,transforma
uma quantidade de dados (nmeros) em informaes teis, que servem
para organizar, analisar, apresentar, representar e interpretar dados sobre
um determinado fenmeno. Todo esse procedimento ajuda-nos a enten-
der o fenmeno e dar apoio tomada de deciso.
Todas as cincias se desenvolveram bastante nas ltimas dcadas e,
dentro desse desenvolvimento a estatstica tambm vm se ampliando e se
constituindo em metodologias, que tem se apropriado de conhecimentos
edetecnologiasexistentesdasreasafns,principalmentedaMatemtica
e da Computao, fazendo com que os clculos complexos e demorados
sejam resolvidos facilmente atravs de pacotes estatsticos disponveis no
mercado(programasdecomputadoresespecfcosparaestatstica).
A Estatstica Descritiva de extrema importncia na anlise inicial
dos dados coletados de um determinado fenmeno. O seu uso serve para:
organizar, analisar, interpretar e descrever um conjunto de dados. Embora
jsedisponhademtodosestatsticosbemsofsticados,muitosproblemas
do nosso dia-a-dia podem ser resolvidos com a Estatstica Descritiva. Os
mtodos de Inferncia Estatstica so utilizados principalmente para tomar
decises diante de incertezas que so inerentes aos fenmenos aleatrios.
14
1.2 Populao e Amostra
Populao o conjunto de todos os elementos (pessoas, animais, domi-
clios ou objetos) que tm pelo menos uma caracterstica ou atributo em
comum de interesse no fenmeno em estudo. A seguir veremos alguns
exemplos:
Exemplo 1.1 Suponha que queremos estudar o perfl scio-econmico
dos estudantes do Ensino Mdio da cidade de So Gabriel da Cachoeira.
Ento, o fenmeno em estudo o perfl scio-econmico dos estudan-
tes do Ensino Mdio e a populao formada por todos os estudantes
matriculados nas escolas de Ensino Mdio da cidade de So Gabriel da
Cachoeira.
Exemplo 1.2 Para estudar o consumo mensal de energia (em kW/h) num
determinado bairro da cidade de So Gabriel da Cachoeira, o fenmeno
em estudo o consumo de energia e a populao formada por todos os
domiclios do bairro estudado.
Exemplo 1.3 Imagine agora que queremos fazer um levantamento sobre
operfldasdapopulaonacidadedeSoGabrieldaCachoeira.Ento,o
fenmeno em estudo a populao de todos os habitantes que residem na
cidade (sendo a grande maioria da populao da regio local entre outros
imigrantes).
Amostra uma parte da populao, selecionada de maneira criteriosa,
para efetivamente fornecer os dados representativos para o estudo.
Uma amostra representativa de uma populao pode ser obtida
escolhendo-se aleatoriamente os elementos que iro compor a amostra, e
isso nos permite fazer inferncias sobre a populao.
No Exemplo 1.1, a amostra composta por parte dos estudantes
do Ensino Mdio da cidade de So Gabriel da Cachoeira, enquanto que
no Exemplo 1.2 a amostra formada por alguns domiclios do bairro es-
tudado, escolhidos aleatoriamente.
Duas observaes so importantes: a primeira que devemos usar
procedimentos estatsticos para determinar o tamanho da amostra, ou
14 15
seja, quantos elementos devem ser selecionados para fazer parte da amos-
tra; e a segunda utilizar o mtodo adequado para a seleo dos elementos
da amostra, isto , o plano de amostragem.
Algumas questes surgem, quando pensamos em amostragem,
dentre as quais: Como ser selecionada a amostra? Qual ser o tipo de
amostragem? Dentre os tipos de amostragem ser aleatria ou no? Quem
far parte da amostra? Quem no far parte da amostra?
Lembramos que a amostra est diretamente ligada aos objetivos da pes-
quisa, deste modo, para decidir sobre o tamanho da amostra e o mtodo
de seleo da amostra, necessrio ter informaes sobre o universo a
ser pesquisado.
1.3 Alguns tpicos importantes na
seleo da amostra.
1.3.1 Identifcao dos objetivos da pesquisa e
populao
Ao realizarmos uma pesquisa importante avaliar alguns pontos:
Oprimeiropontoseriaidentifcarasrazeseantecedentesdapes-
quisa,paraentodefnirosobjetivosgerais,operacionaisealternativos.
Segundopontoseriaidentifcarasunidadesdeanliseeresposta,
assim como estabelecer populao-alvo de interesse (as sub-populaes,
no caso de estratos).
Outro ponto a especifcao das variveis de interesse, bem
comodefniraspossveisunidadesdemedidas.
1.3.2 Coleta dos dados
Estabelecer o modo de coleta na pesquisa de campo: entrevista di-
reta, observao, individual, em grupo, por carta, telefone, e-mail, baseado
na elaborao de um instrumento de pesquisa (formulrio, questionrio
entre outros). Neste contexto, muito importante operacionalizar os con-
16
ceitos de variveis.
1.3.3 Planejamento e Seleo da amostra
A preciso estatstica para pesquisa esbarra nas limitaes impos-
tas pelo oramento, na operacionalidade e na logstica, seja no campo, ou
no laboratrio. Deste modo necessrio avaliar custo do levantamento da
pesquisa, para saber o quanto vai ser gasto para coletar os dados.
1.3.4 Critrios de incluso e excluso dos
elementos da amostra
Antesdeobteraamostraprecisodefnirexatamenteapopulao
de onde essa amostra ser retirada, ou seja, preciso saber a confgura-
o da populao. Na confgurao da populao, preciso estabelecer
os critrios para selecionar os elementos ou sujeitos que iro constituir a
amostras.Assimcomodefnirossujeitosquenopoderoparticiparda
amostra.
1.3.5 Quais as tcnicas para seleo da
amostra
Os princpios bsicos da teoria da amostragem so expressos por
meio de uma linguagem simples, apresentando os recursos empricos fa-
miliares a quem j utiliza os procedimentos descritivos da estatstica em
seus estudos, ou atividades de pesquisas. Neste captulo, sero delimitadas
as caractersticas bsicas dos planos de observao e a localizao dos pro-
cedimentosdaamostragem,noprocessodainvestigaocientfca.
Narealizaodeumainvestigaocientfcaqueremosfazerafr-
maes sobre caractersticas de uma determinada populao, que assegu-
16 17
removalorcientfcodasinformaesobtidasedasconclusesalcana-
das,isto,aconfabilidadedosresultadosdoestudo.
Aamostragemtemafnalidadedereunirasseguintescaractersticas
operacionais:
Seraplicadoaumconjuntodedadosreaisefnitos,compostodeele-
mentos ou sujeitos de uma populao em estudo;
Estes elementos podem ser animais, plantas, ou sujeitos de pesquisas,
como seres humanos coletados de maneira direta (entrevistas, como
roteiros de pesquisas e formulrios, ou mesmos questionrios) ou in-
direta por meio de bancos de dados (fchas cadastrais, pronturios,
entre outros) em uma determinada comunidade. (Lembrando que,
pesquisas com seres humanos de maneira direta ou indireta, o projeto
de pesquisa dever ser submetido aprovao em um Comit de tica
em Pesquisa CEP, conforme (Resoluo 196/96 MS), antes de fazer
pesquisa);
As caractersticas ou atributos so observados em cada elemento da
amostra, e posteriormente agregados por meio de medidas estatsticas,
denominadas valores populacionais;
Os dados so coletados em amostras da populao em estudo e as
medidas calculadas (estimativas) passam a ser a informao disponvel
para os valores populacionais desconhecidos.
Em geral, estudo de levantamento quase impossvel observar to-
dos os elementos da populao em estudo, principalmente pelo tempo e
o custo operacional. Portanto, precisa-se selecionar uma amostra. Na qual
se deve escolher uma amostra que seja representativa da populao. As-
sim, escolhendo-se criteriosamente as unidades amostrais, teremos segu-
rana para usar a inferncia estatstica e generalizar os resultados obtidos
na amostra para a populao.
Alguns conceitos so necessrios e sero reforados a seguir:
Populao o conjunto de todos os elementos (animais, plantas,
pessoas, domiclios ou objetos) que tm pelo menos uma caracters-
tica ou um atributo em comum de interesse do estudo.
Censo - quando consideramos todos os elementos da populao,
em um estudo, realizamos um censo. Em geral, a realizao de um
censo demanda muito tempo e alto custo, da o Brasil fazer o censo
a cada dez anos. Por outro lado, o censo se torna vivel tambm,
18
quando a populao pequena e fcil o acesso aos elementos da
populao.
Amostra uma parte da populao, selecionada de maneira criterio-
sa, para efetivamente fornecer os dados para o estudo.
Deste modo, necessrio a formulao do problema e determinar
qual o objeto de pesquisa, para poder defnir o plano de amostragem
com elementos de ligao na operacionalidade do estudo, que compreen-
de desde o clculo do tamanho da amostra e do plano amostral.
1.3.6 Plano de Amostragem
Aelaboraodoplanodeamostragemsignifcaconstruirsolues
para determinar o nmero de elementos a serem observados, mas tambm
as condies concretas para operacionalizar os planos de observao e
anlise no processo de amostragem.
Em geral, escolhemos um tamanho mnimo de amostra necessrio
para estimar uma proporo populacional - ou uma mdia populacio-
nal - ,comumaaceitvelmargemdeerro-paramaisouparamenose
a probabilidade de ocorrer um erro menor ou igual ao erro aceitvel deve
seralta,isto,umintervalodeconfanade (1 ) 100% . Ou seja, de-
vemos escolher n de modo que,
(| | ) 1 P p ou (| | ) 1 , P x
onde p a proporo amostral e x a mdia amostral.
A partir da, fazendo algumas suposies e alguns clculos, vamos
encontrar, respectivamente,
2
/ 2
0
2
(1 )
z
n

= ou
2
2
/ 2
0
2
z
n

=
Se a populao em estudo tem um nmero fnito de elementos,
devemos fazer a correo de populao fnita como segue:
0
0
1
n
n
n
N
=
+
18 19
Onde N o tamanho da populao do estudo.
Em seguida, de acordo com os objetivos do estudo, determina-
mos o procedimento amostral (mtodo) mais apropriado entre os tipos
de amostragens: aleatria Simples, amostragem sistemtica, amostragem
estratifcada,entreoutras.
Podemos observar que, na frmula para o clculo do tamanho da
amostra, aparecem as quantidades desconhecidas ou
2
. Este proble-
ma contornado usando-se em seu lugar as respectivas proporo amos-
tral p ou varincia amostral
2
S , que podem ser obtidas de uma amostra
piloto.
Exemplo 1.4: Suponha que queremos avaliar o estado nutricional de
escolares (entre 6 a 10 anos) na rede de ensino pblico em Manaus,
por exemplo, neste ano. O clculo da amostra poderia ser realizado levan-
do-se em conta a rea metropolitana de Manaus, levando-se em conside-
rao a demanda escolar semanal e a prevalncia de 15%, poderia ser a
prevalncia de desnutrido estimada entre os desvios nutricionais dos esco-
lares ) 15 , 0 ( p
. Admitindo-se para composio da amostra a ser estuda-
da um erro amostral tolervel de 5%
) 05 , 0 (
0
e
eumnveldeconfana
de 95%, isto , 100 ) 1 ( , ( 96 , 1
2

Z ) .
( )
( )
2
2
2
0
1 ) (
e
p p Z
n

=




196
05 , 0
15 , 0 1 15 , 0 96 , 1
2
2
0

n
Utilizando-se a frmula para correo para populaes fnitas, com
N=64.857 crianas de 6 a 10 anos (IBGE, 2000), temos
N
n
n
n
0
0
1+
= 215 9 , 214
64857
196
1
196
=
+
= n
Aps o clculo da amostra, algumas vezes, necessrio levar em conside-
rao, no tamanho da amostra, possvel perdas por preenchimento de for-
mulriooudevoluesdequestionriosafmdecompensaraspossveis
perdas, resguardaremos um nvel de 5%.
Com uma compensao das perdas de 5% equivale a uma amostra com no
mnimo 225 escolares.
20
Aseguirrepresentamosoquadroosintervalosdeconfana ) 1 ( mais
frequentemente utilizados com os correspondentes valores de
2

z .
Quadro 1 Quadro Retirado da Tabela Normal Padro (Tabela C).
1.3.7 Seleo da amostra
Resumidamente, podemos selecionar os elementos da amostra da
seguinte forma: a) Quando a populao homognea conforme a vari-
vel de interesse usa-se amostra aleatria simples; b) Quando se sabe que
a populao no homognea, conforme a varivel de interesse usa-se
amostragemestratifcada,ouseja,dividi-seapopulaoemgruposhomo-
gneos (estratos) e realiza-se amostragem aleatria simples em cada estra-
to; c) H outros mtodos de amostragens como amostragem sistemtica e
amostragem por conglomerado.
1.4 Como selecionar a amostra?
De um lado, uma amostra representativa de uma populao pode
ser obtida escolhendo-se aleatoriamente os elementos que iro compor
a amostra e isso nos permite calcular estimativas de erros no processo
inferencial. Amostras obtidas desta forma so chamadas de Amostras
Probabilsticas,nestecasofcaclaramentedefnidaaprobabilidadede
um elemento qualquer fazer parte da amostra.
Por outro lado, o plano de amostragem consiste em decidir qual

(1-) Z/2
0,80 1,282
0,95 1,960
0,99 2,576
20 21
o modelo de sorteio e o tipo de amostragem adequado para a seleo da
amostra seja probabilstica, ou no, adequado s condies propostas no
plano de observao. Neste livro, a amostragem no probabilstica no
far parte.

1.4.1 Amostragem Aleatria Simples
Quando a populao homognea, segundo a caracterstica esco-
lhida para o estudo, os elementos da populao so numerados de 1 a N e
em seguida, sorteia-se aleatoriamente n nmeros compreendidos entre 1
e N . A amostra ser composta pelos n nmeros sorteados.
1.4.2 Amostragem Estratifcada
Quando a populao sabidamente no homognea em relao
caracterstica escolhida para o estudo, mas pode ser dividida em grupos
homogneos,maisfcileefcienteescolherumaamostraaleatriasim-
ples de cada grupo. Estes grupos so chamados de estratos.
Esse mtodo de amostragem bastante utilizado, pois em muitos
estudos a populao tem estratos bem defnidos e comumente usa-se a
amostragemestratifcadaproporcional,isto,otamanhodaamostraem
cada estrato proporcional ao tamanho do estrato.
Exemplo 1.5 Suponha que vamos tomar uma amostra de 10 alunos de
uma classe com 50 alunos dos quais 32 so mulheres. A populao ser
estratifcadaporgnero.Ento,otamanhodapopulao 50 N = , o ta-
manho de estrato corresponde aos homens 18
H
N = e o tamanho do
estrato corresponde s mulheres 32
M
N = . Calculando o tamanho da
amostra 10 n = , proporcional ao tamanho de cada estrato, encontramos.
18
10 3, 6 4
50
H
H
N
n n
N
= = =

22
32
10 6, 4 6
50
M
M
N
n n
N
= = =
.e
Observe que
H M
N N N = + e
H M
n n n = + . Ou seja, o tamanho da po-
pulao igual soma dos tamanhos dos estratos e o mesmo ocorre com
o tamanho da amostra, isto , sero selecionados proporcionalmente ho-
mens (4) e mulheres (6).
1.4.3 Amostragem Sistemtica
bastante utilizada por sua simplicidade operacional. De uma
populao de N elementos, escolhem-se n elementos a cada intervalo de
amplitude r , sendo r o inteiro mais prximo de / N n .
A amostra ser formada pelos elementos escolhidos seqencial-
mente de ordem , , 2 , , ( 1) k k r k r k n r + + + , onde k qualquer intei-
ro escolhido aleatoriamente entre 1 e n .
Exemplo 1.6: Vamos selecionar uma amostra sistemtica de oito alunos
de uma turma de 50 alunos de uma classe em So Gabriel da Cachoeira.
Usamos o Dirio de Classe onde consta o nome dos alunos em ordem al-
fabtica. Aqui 50 N = , 8 n = e 50/ 8 6, 3 6. r = = Suponha que entre 1
e 8 sorteamos o nmero 6. Assim, faro parte da amostra os alunos cujos
nmeros no boletim correspondem a 6, 12, 18, 24, 30, 36, 42 e 48.
Exemplo 1.7: Suponha que Jos candidato a Prefeito de uma cidade
com, digamos, 10.000 habitantes. Ele quer saber qual a proporo de
eleitores com inteno de votar nele. Para responder essa questo, antes
detudodevefcarclaroqueapopulaoaserpesquisadanoapopula-
o dos habitantes do Municpio, e sim a populao formada por todos
22 23
os eleitores com domiclio eleitoral naquela cidade. Para estimar a
proporo desejada, Jos admite um erro de 5% e fca estabelecido que
sejausadoumintervalode95%deconfana.Nestecasootamanhoda
amostra ser calculado como:
2
/ 2
0
2
(1 )
z
n

= ,
onde 0, 05 = , obtido da Tabela A - distribuio normal
/ 2 0,025
1, 96 z z

= = , e verdadeira proporo de eleitores de Jos. Essa


proporo desconhecida e devemos estim-la usando uma amostra pi-
loto ou usando o valor mximo
2
1
= , e
2
1
1 = , isto , (1 )
que igual a . Assim, o tamanho inicial da amostra dado por:
2
0
2
(1, 96) 1
384,19 385
(0, 05) 4
n = = .
Supondo que na cidade existem, registrados, 4.852 eleitores, deve-
mosfazeracorreodepopulaofnitaeotamanhofnaldaamostrafca
dado por
385
357
385
1
4852
n = =
+
No caso do estudo da eleio para Prefeito da cidade, uma forma
razovel de se fazer a amostragem dividir a populao em estratos, cada
estrato correspondendo, por exemplo, aos bairros da cidade. O tamanho
da amostra em cada bairro (estrato) deve ser proporcional ao tamanho da
populao do bairro. Escolhendo-se aleatoriamente os domiclios dentro
do bairro e de cada domiclio poderemos entrevistar um eleitor.
1.5 Defnio e classifcao de
variveis
Noexemplo1.1,estudodoperflsocioeconmicodosestudantes
doEnsinoMdiodacidadedeSoGabrieldaCachoeirafcasubentendi-
24
do que, estamos querendo conhecer, normalmente, algumas variveis de
interesse, por exemplo: sexo, idade, renda familiar, nmero de flhos na
famlia, escolaridade dos pais, entre outras variveis socioeconmicas.
importante diferenciar os tipos de variveis para podermos dar
otratamentoestatsticoadequadosmesmas.Asvariveissoclassifcadas
como qualitativas ou quantitativas.
1.5.1 Varivel Qualitativa
A Varivel Qualitativa representa uma qualidade e seus valores so
categorias. De acordo com as categorias, pode ser subdividida em Qua-
litativa Nominal, se as categorias no impem uma ordem natural, ou
Qualitativa Ordinal, se as categorias impem uma ordem natural.
Exemplo 1.8 Variveis Qualitativas Nominais Nacionalidade (brasi-
leira, colombiana, venezuelana, portuguesa,...); Religio (catlica, evangli-
ca,...); Sexo: (masculino, feminino,...). Observa-se nestas variveis que no
existe uma relao de ordem entre as categorias.
Exemplos 1.9 Variveis Qualitativas Ordinais Escolaridade (Ensino
Fundamental, Ensino Mdio, Ensino Superior); Classe social (A, B, C,...);
Tamanho do manequim de uma pessoa (PP, P, M, G, GG). Neste caso, as
categorias apresentam uma relao de ordem natural.
1.5.2 Varivel Quantitativa
A Varivel Quantitativa representa uma quantidade e seus va-
lores so numricos. Podem ser subdivididas em quantitativa discreta,
quando seus valores so pontos sobre a reta, geralmente resultado de uma
contagem, ou quantitativa contnua, quando seus valores esto num in-
tervalo da reta, geralmente o resultado de uma medida.
Exemplo1.10VariveisquantitativasdiscretasNmerodeflhospor
famlia (0, 1, 2,...); Nmero de computadores por domiclio (0, 1,...);
Nmeros de celulares por domiclio (0, 1,...); Nmeros de quartos por
domiclios (0,1,...); Nmeros de mensagens recebidas por dia (0, 1, 2, 3,
...), entre outras. Neste caso, refere-se a resultado de contagem da vari-
24 25
vel de interesse.
Exemplo 1.11 Variveis Quantitativas Contnuas idade e peso de indi-
vduo (em quilograma), altura de indivduos (em centmetro ou em metro),
entre outras.
As variveis so avaliadas e registradas conforme o objeto de estu-
do, sendo realizadas em diferentes unidades de medidas. Por exemplo, no
estudodoperfldosestudantesdoEnsinoMdiodacidadedeSoGabriel
da Cachoeira, o pesquisador tem como unidade amostral, estudante do
Ensino Mdio e as variveis poderiam ser: altura, idade, renda familiar
e tipo de escola em que est matriculado o estudante. O valor da vari-
vel vai depender do estudante avaliado, sendo o valor expresso pela uni-
dade de medida escolhida, por exemplo, a varivel idade em anos; renda
em nmeros de salrios mnimos, altura poder ser medida em centmetro
(ou metro).
1.6 Coleta de dados
Emtodapesquisadelevantamentoondequeremosfazerafrma-
es sobre caractersticas de uma populao, surgem dois problemas que
devemsertratadoscombastanteatenoparaaconfabilidadedosresul-
tados do estudo. O primeiro diz respeito ao nmero de unidades a serem
observadas, o tamanho da amostra, anteriormente, j visto. O segundo
refere-se ao plano amostral, isto , como operacionalizar a coleta dos
dados.
Na realizao de estudos dessa natureza quase impossvel obser-
var todos os elementos da populao em estudo, principalmente pelo tem-
po e o custo operacional. Portanto, tendo que trabalhar com uma amostra,
deve-se escolher uma amostra que seja representativa da populao.
Assim, escolhendo-se criteriosamente as unidades amostrais teremos se-
gurana para usar a inferncia estatstica e generalizar os resultados obti-
dos da amostra para a populao.
26
1.6.1 Fontes de dados
As fontes de dados podem ser primrias e secundrias:
Fontes primrias: Dizemos que a fonte primria quando o pr-
prio pesquisador gera a informao. A fonte primria mais utilizada a
observao direta de um fenmeno, por ser um mtodo clssico na pes-
quisa de campo, baseado ou no em um instrumento de pesquisa usado
para levantamento de dados. Tais como, temperatura mdia diria em uma
determinadaregioouondicedeinfaomensaldecertopas.
Fontes secundrias: So bancos de dados ou arquivos previamente exis-
tentes, onde esto armazenadas as informaes que sero utilizadas no
levantamento, ou seja, os dados j existem e o pesquisador ir lanar mo
delesparadesenvolverseuestudo.Asfchasdecadastrodeestudantesou
de clientes de uma loja de departamentos so exemplos de fontes de dados
secundria.
1.6.2 Construo do instrumento de pesquisa
O instrumento de pesquisa o objeto que rene um conjunto de
questes para gerar um documento padro onde sero coletados e regis-
trados os dados da pesquisa. O instrumento precisa ser bem adequado
e direcionado aos objetivos da pesquisa. Para o xito do instrumento de
pesquisa devemos levar em conta que:
As questes devem ser formuladas de forma mais simples poss-
vel;
Devemos facilitar as respostas dos entrevistados;
Demos elaborar as perguntas de forma clara para facilitar a com-
preenso do respondente;
Devemos estimular a memria do sujeito entrevistado;
Devemos evitar a realizao de clculos;
26 27
Devemos evitar palavras tcnicas no instrumento;
Devemos evitar perguntas dbias;
Devemos evitar perguntas sugestivas;
Devemos evitar grande nmero de questes em questionrio;
Devemos evitar questes com respostas abertas, mas podemos
permitir a existncia de espao para uma resposta adicional.
1.6.3 Amostra piloto ou pr-teste
Aps a aprovao do projeto de pesquisa em um Comit de tica
em Pesquisa, importante efetuar uma amostra piloto para testar, pre-
viamente, esse instrumento, pois, somente com aplicao efetiva do ins-
trumento que poderemos detectar falhas, e, com isso, corrigi-las. E se
constitui naquilo que denominamos de pr-teste.
Em sua aplicao, as falhas podero ser detectadas. Nesse momen-
to, poderemos detectar: a ambigidade de questes; necessidade de novas
questes; respostas que no haviam sido previstas; entre outras. O pr-
-teste ainda possibilita a estimativa do tempo de aplicao do instrumento,
assim como a atualizao do nmero de elementos da amostra.
1.6.4 Recursos Computacionais
Como ns indicamos, no incio deste livro, o avano computacio-
nal foi fundamental para o crescente uso da Estatstica. Clculos cansati-
vos agora so realizados apenas com um clique no mouse. Pacotes esta-
tsticos como Minitab, Statistica e SPSS, so bastante interativos e de fcil
manuseio, mas em geral, o custo de uma permisso de uso muito alto.
Um pacote estatstico de uso livre e bastante utilizado pelos esta-
tsticos e usurios da estatstica o chamado R, encontrado em (http://
www.r-project.org).
A planilha eletrnica Excel (Microsoft Offce Excel 2003) tem
28
Exerccio do captulo 1
1) Escreva a unidade de medida e faa a classifcao das variveis
conforme as legendas: Quantitativa Contnua QTC; Quantitati-
va Discreta QTD; Qualitativa Ordinal QLO; Qualitativa No-
minal QLN.
a) Peso de um pirarucu pescado com arpo (kg)
b) Desperdciodealimentoaofnaldamerendaescolarporturno
(em kg)
c) Temperatura (em grau Celsius)
d) Medio da presso arterial sistlica (mg/ml)
e) Nmero de ligaes telefnicas recebidas ao dia
f) Durao de uma chamada telefnica (min)
g) Hierarquia em uma empresa
h) Hierarquia militar
i) Peso de bagagem (em kg)
j) Desperdciodealimentoaofnaldamerendaescolarporturno
(em kg)
k) Regies do Brasil (centro-oeste, nordeste, norte, sudeste e sul)
l) Time de futebol em So Gabriel da Cachoeira
m) Temperatura (em grau Celsius)
n) Escolaridade
o) Medio da presso arterial sistlica (mg/ml)
p) Nmero de acidentes de trnsito
2) O que voc entende por populao, amostra e censo?
3) Em uma cidade foram arroladas 68 casas comerciais que vendem
o produto P, numeradas de 1 a 68 em uma listagem. Como es-
colher sistemtica e aleatoriamente uma amostra de tamanho 20
28 29
dessas casas de comrcio?
4) Considere que a rede pblica municipal do ensino fundamental de
um municpio tem 3500 alunos matriculados e distribudos em 12
escolas.Suponhaqueoobjetivodapesquisasejaestudaroperfl
dos alunos.
a) Qual a populao?
b) Determine o tamanho da amostra com erro de 5% e intervalo
deconfanade95%;
c) Que tipo de amostragem voc usaria?
5) Combasenatabelaaseguir,useamostragemaleatriaestratifca-
da. Determine o tamanho total da amostra e o tamanho da amos-
traemcadabairro.Considereerrode5%eintervalodeconfana
de 95%.
Tabela 1 Nmero de famlias nos bairros mais populosos de uma cidade
X.











Bairros Nmero de famlias
Compensa 142
Alvorada 89
Japiim 113
Flores 89
Cidade Nova 97
So Jos Operrio 79
Total 609
30
30 31
vrias ferramentas estatsticas e ser utilizada no desenvolvimento deste
curso.
Mas necessrio que se tenha a clareza de que o computador rea-
liza as tarefas que voc ordena. Portanto, imprescindvel que o adminis-
trador, ou qualquer profssional, tenha o conhecimento das ferramentas
estatsticas, para usar com propriedade os recursos computacionais dispo-
nveis para a anlise de dados.
Captulo 2 Organizao de dados
2.1 Apresentao de Dados em Tabelas
A apresentao de tabelas permite a condensao de dados de
modo a torn-los de fcil compreenso. Os dados devem ser apresentados
em tabelas de acordo com normas tcnicas estabelecidas pela Fundao
InstitutoBrasileirodeGeografaeEstatstica(IBGE,1993).
2.2 Componentes das tabelas
As tabelas tm ttulo, corpo, cabealho e coluna indicadora. O ttu-
lo explica o que contm a tabela. O corpo formado pelas linhas e colunas
dedadosdatabela.Ocabealhodatabelaespecifcaocontedodascolu-
naseacolunaindicadoraespecifcaocontedodaslinhas.Afonteindica
o local de onde foram retirados (Tabela 2).
Tabela 2. Populao por bairro, na cidade de So Gabriel da Cachoeira, no ano de 2003.




Bairro Populao
Areal 3.119
Boa Esperana 992
Centro 1.306
Dabaru 3.425
Fortal eza 1.629
Graciliano 632
Nova Esperana 815
Padre C cero 795
Prai a 892
So Jorge 187
Total 13.792
Fonte: ISA 2004

Ttulo
Coluna indi cadora
Corpo
Cabealho
32
Toda tabela dever ser delimitada por traos horizontais. Podem
ser feitos traos verticais para separar as colunas, mas no devem ser
feitos traos verticais para delimitar a tabela. O cabealho separado do
corpo por um trao horizontal.
As tabelas podem apresentar as freqncias absolutas, as freqn-
cias relativas e o total. Para obter a freqncia relativa de uma categoria,
divide-se a freqncia dessa categoria pelo total, isto , a soma das fre-
qncias. O total da coluna escrito entre traos horizontais.
As tabelas podem conter fonte, notas e chamadas. A fonte d
indicao da entidade, ou do pesquisador, ou dos pesquisadores que pu-
blicaram ou forneceram os dados. Como exemplo, na tabela 2 a fonte
o ISA - Instituto Socioambiental, (Azevedo, 2004). As notas e chamadas
devem esclarecer aspectos relevantes do levantamento dos dados ou da
apurao; quando existentes, devem ser apresentadas aps a fonte.
2.3 Tabelas de Dupla entrada
Muitas vezes os elementos da amostra ou da populao so
classifcadoscommaisdeumfator.Osdadosdevementoserapresen-
tados em tabela de contingncia, isto , em tabelas de dupla entrada, cada
entrada referente a um dos fatores. Como exemplo, veja a Tabela 3, que
apresenta o nmero de nascidos vivos registrados. Note que eles esto
classifcadospordoisfatores:oano de registro e o sexo.
Tabela 3 Nascidos vivos registrados por sexo e o ano de registro, 1988.
Ano de regi stro
Sexo
Total
Masculino Femenino
1984 1.307.758 1.251.280 2.559.038
1985 1.339.059 1.280.545 2.619.604
1986 1.418.050 1.361.203 2.779.253

32 33
2.4 Tabelas de distribuio de freqn-
cias
A partir de dados brutos (tendo estes dados uma grande variao dos
seus valores), podemos construir uma tabela com as informaes resu-
midas e mais informativas possvel, para cada varivel do estudo. Como
exemplo do Quadro 1.
Quadro 2 Dados brutos da varivel peso de crianas ao nascer (kg).
As tabelas com grande nmero de dados (muita informao) so
cansativas e no do ao leitor uma viso rpida e global do fenmeno es-
tudado, ou seja, deixa sem resposta, as questes de interesse, como pode
ser observado na tabela 3.
Essa tabela (denominada de tabela de distribuio de freqncia),
como o nome indica, conter os valores da varivel e suas respectivas
contagens, sendo denominada freqncia absoluta, ou simplesmente fre-
qncia. Existem dois tipos de tabelas de distribuio de freqncias: dis-
tribuio de freqncia pontual e distribuio de freqncia em classes.
DADOS BRUTOS
2,522 3,200 1,900 4,100 4,600 3,400
2,720 3,720 3,600 2,400 1,720 3,400
3,125 2,800 3,200 2,700 2,750 1,570
2,250 2,900 3,300 2,450 4,200 3,800
3,220 2,950 2,900 3,400 2,100 2,700
3,000 2,480 2,500 2,400 4,450 2,900
3,725 3,800 3,600 3,120 2,900 3,700
2,890 2,500 2,500 3,400 2,920 2,120
3,110 3,550 2,300 3,200 2,720 3,150
3,520 3,000 2,950 2,700 2,900 2,400
3,100 4,100 3,000 3,150 2,000 3,450
3,200 3,200 3,750 2,800 2,720 3,120
2,780 3,450 3,150 2,700 2,480 2,120
3,155 3,100 3,200 3,300 3,900 2,450
2,150 3,150 2,500 3,200 2,500 2,700
3,300 2,800 2,900 3,200 2,480 -
3,250 2,900 3,200 2,800 2,450 -

34
2.5 Tabela de distribuio de freqncia
pontual
A apresentao da tabela de freqncia sem intervalos de clas-
ses, isto , uma tabela de distribuio de freqncia pontual, na tabela 4.
Lembrando que todo ttulo de tabela deve conter a localizao e a data do
fenmeno.
Tabela 4 Nmero de domiclios por bairros e regio de nascimento do responsvel em
So Gabriel da Cachoeira/AM, 2003.
Bairros
Local de Nascimento
Total
SGC Regio Fora da Regio
Areal 95 340 142 577
Boa Esperana 18 102 53 173
Centro 67 88 141 296
Dabaru 75 329 190 594
Fortal eza 144 86 157 387
Graciliano 22 61 30 113
Nova Esperana 14 88 22 124
Padre C cero 15 90 19 124
Prai a 47 62 40 149
So Jorge 3 17 2 22
Total 500 1263 796 2559
Fonte: ISA (2003)
Nota: Levantamento Preliminar de origem preliminar dos responsveis pelo domi clio

34 35
Tabela 5 Nveis de escolaridade da Empresa X, no Polo Industrial de Manaus, 2010.
2.6 Tabelas de distribuio de freqn-
cias em classes
Imagine que, para dar uma idia geral sobre o peso ao nascer de nascidos
vivos, o pesquisador ir apresentar no os pesos observados, mas o n-
mero de nascidos vivos por faixa de peso. Deve-se, ento, construir uma
tabela de distribuio de freqncias.
2.7 Construo de uma tabela de
distribuio de freqncia em classes
1
o
PASSO: Organizamos todos os dados em ordem crescente ou decres-
cente.
Quadro 3 Dados em ordem crescente da varivel peso de crianas ao nascer (kg)
Nveis de
Escolaridade
Nmero de
Empregados
Porcentagem
Fundamental 12 33,33
Mdio 18 50,00
Superior 06 16,67
Total 36 100,00

1,570 2,480 2,780 3,000 3,200 3,550
1,720 2,480 2,800 3,000 3,200 3,600
1,900 2,500 2,800 3,100 3,200 3,600
2,000 2,500 2,800 3,100 3,200 3,700
2,100 2,500 2,800 3,110 3,200 3,720
2,120 2,500 2,890 3,120 3,220 3,725
2,120 2,500 2,900 3,120 3,250 3,750
2,150 2,522 2,900 3,125 3,300 3,800
2,250 2,700 2,900 3,150 3,300 3,800
2,300 2,700 2,900 3,150 3,300 3,900
2,400 2,700 2,900 3,150 3,400 4,100
2,400 2,700 2,900 3,150 3,400 4,100
2,400 2,700 2,900 3,155 3,400 4,200
2,450 2,720 2,920 3,200 3,400 4,450
2,450 2,720 2,950 3,200 3,450 4,600
2,450 2,720 2,950 3,200 3,450 -
2,480 2,750 3,000 3,200 3,520 -

36
1,570 2,480 2,780 3,000 3,200 3,550
1,720 2,480 2,800 3,000 3,200 3,600
1,900 2,500 2,800 3,100 3,200 3,600
2,000 2,500 2,800 3,100 3,200 3,700
2,100 2,500 2,800 3,110 3,200 3,720
2,120 2,500 2,890 3,120 3,220 3,725
2,120 2,500 2,900 3,120 3,250 3,750
2,150 2,522 2,900 3,125 3,300 3,800
2,250 2,700 2,900 3,150 3,300 3,800
2,300 2,700 2,900 3,150 3,300 3,900
2,400 2,700 2,900 3,150 3,400 4,100
2,400 2,700 2,900 3,150 3,400 4,100
2,400 2,700 2,900 3,155 3,400 4,200
2,450 2,720 2,920 3,200 3,400 4,450
2,450 2,720 2,950 3,200 3,450 4,600
2,450 2,720 2,950 3,200 3,450 -
2,480 2,750 3,000 3,200 3,520 -

2
o
Passo:VerifcaraAmplitudeTotal(
t
A )
A amplitude total a diferena entre o maior valor observado e o menor
valor observado. Neste caso, ser
030 , 3 570 , 1 600 , 4 = =
t
A
.
3
o
Passo:DefniroNmerodeclasses(faixas)( K )
Onmerodeclassepodeserdefnidopelopesquisador.Umamaneirade
encontraronmerodeclassespodeserdefnidapelafrmuladeSturges.
A frmula de Sturges, ) log( 32 , 3 1 n K , em que n o tamanho da
amostra. Com base aos dados anteriores, 100 = n , calculando K :
7 44 , 7 44 , 6 1 2 22 , 3 1 ) 100 log( 22 , 3 1 = + = + = + = K .
Ou seja, vamos usar inicialmente 7 = K classes.
OBSERVAO: importante deixar claro que o resultado obtido por
esta frmula pode ser usado como referncia, mas cabe ao pesquisador
determinar o nmero de classes em que pretende organizar seus dados.
Quando se constri uma tabela de distribuio de freqncias, melhor
usar, como limites (extremos) de classes, nmeros fceis de trabalhar.
36 37
4
o
Passo: Amplitude das Classes ( h )
Assim como no caso do nmero de classes ( K ), a amplitude das classes (
h ) , na maioria das vezes, trabalhada em relao ao maior inteiro, isto ,
dependendo da natureza dos dados. Para calcular a amplitude de classes,
utiliza-se a seguinte frmula:
t
A
h
t
=
Ento, a amplitude de classes para os dados em questo ser:
5 , 0 43 , 0
7
03 , 3
h
5
o
Passo: Limites das classes
Existem diversas maneiras de expressar os limites das classes. Por exemplo:
a) 10 12 compreendem todos os valores entre 10 e 12;
b) 10 12 compreendem todos os valores de 10 a 12, excluindo o 12;
c) limite aparente 10 12; limite real 9,5 11,5;
d) 10 12 compreendem todos os valores, excluindo o 10.
Nota: Usualmente se utiliza o intervalo do exemplo b, que tambm ser
utilizado na tabela de distribuio de freqncias que construiremos.
6
o
Passo: Construo da tabela de distribuio de freqncias, tabela 6.
38
Tabela 6 Nascidos vivos segundo o peso ao nascer, em quilogramas.
Observao: A tabela distribuio de freqncia deve ter uma formata-
o adequada de acordo com as normas vigentes. Na coluna das classes,
em relao primeira classe onde o intervalo de classe 1,570 2,070,
trabalhou-se com a menor observao sendo o limite inferior (1,570) e
o limite superior (1,570 + 0,5 = 2,070) a soma do limite inferior com a
amplitude de classes ( h ).
2.8 Tipos de freqncias
Numa distribuio de freqncia pode-se trabalhar com alguns ti-
pos de freqncia, discriminados a seguir:
Freqncia absoluta ( fi ) o nmero de vezes que o elemento
aparece na amostra, ou nmero de elementos pertencentes a uma classe.
Classes de peso Frequncia
1,570 2,070
04
2,070 2,570
20
2,570 3,070
29
3,070 3,570
33
3,570 4,070
09
4,070 4,570
04
4,570 5,070
01
TOTAL 100

38 39
Freqncia relativa (
r
fr
) o valor da freqncia absoluta divi-
dido pelo nmero total de observaes, ou seja,
n
f
fr
i
i

.
Freqncia acumulada (
i
fa
) a soma das freqncias absolu-
tas at a classe i .
Freqncia relativa acumulada (
i
fra ) o valor da freqncia
acumulada dividido pelo nmero total de observaes, ou seja,
n
fr
fra
i
i

.
2.9 Medidas de posio para dados
agrupados
Tem por objetivo descrever um conjunto de dados de forma orga-
nizada e compactada que possibilite a visualizao do conjunto estudado
por meio de suas estatsticas.
2.9.1 Mdia aritmtica (
X
) para dados agrupados
Sem intervalo de classe - Consideremos a distribuio de freqncia abaixo, para o
nmerodefamliascomflhosdosexomasculinoem34famliascomatquatroflhos.
Vamos determine a mdia de meninos por famlia.
40
Tabe;la7Nmerodefamliascomflhosdosexomasculino
Como as freqncias so os nmeros de vezes em que cada valor da
varivel aparece, elas funcionam como fatores de ponderao, o que nos
leva a calcular a mdia aritmtica ponderada, dada pela frmula:
1
.
78
2, 29.
34
n
i i
i
i
x f
X
f
=
= = =

Portanto, h uma mdia de dois flhos do sexo masculino por famlia,


aproximadamente.
COM INTERVALOS DE CLASSE - Neste caso,
convencionamos que todos os valores includos em um determinado
intervalo de classe coincidem com o seu ponto mdio e determinamos a
mdia aritmtica ponderada por meio da frmula:

=
=
i
n
i
i i
f
f x
X
1
.
, onde:
i
f freqncia da classe i e
i
x o ponto mdio da
classe i .
Exemplo: Calcular a estatura mdia de crianas em uma creche, conforme
a tabela abaixo. Aplicando a frmula acima temos:
2440
61
40
X cm = = , as crianas tm em mdia 61 centmetros de altura..
Nmero de filhos homens (
i
x ) Frequncia (
i
f )
i i
x f
0 02 0
1 06 6
2 10 20
3 12 36
4 04 16
Total 34 78

40 41
Tabela 8 Estatura mdia de crianas em uma creche.
2.9.2 Mediana -
d
M
A mediana de um conjunto de valores, dispostos segundo uma ordem
(crescente ou decrescente), o valor situado de tal forma no conjunto que
o separa em dois subconjuntos de mesmo nmero de elementos.
SEM INTERVALOS DE CLASSE: Neste caso, o bastante
identifcar a freqncia acumulada imediatamente superior metade
da soma das freqncias. A mediana ser aquele valor da varivel que
corresponde a tal freqncia acumulada. Exemplo: Conforme tabela a
seguir:
Tabela 9 Nmero de banheiros por domiclios

Estatura (cm) Frequncia (
i
f ) Ponto mdio (
i
x ) .
i i
x f
.
50 54
04 52 208
54 58
09 56 504
58 62
11 60 660
62 66
08 64 512
66 70
05 68 340
70 74 03 72 216
Total 40 - 2.440
Nmero de
banheiros
(
i
X )
Frequncia
(
i
f )
Frequncia acumulada
(
i
fa )
0 02 02
1 06 08
2 09 17
3 13 30
4 05 35
Total 35 -

42
Quando o nmero de elementos na amostra ( n
)
for mpar, o valor
mediano ser o valor dos dados ordenados que ocupe a ordem dada
pela frmula
2
1 + n
, ou seja,
. 18
2
1 35


Ser, portanto, o dcimo oitavo
elemento (18
0
).Paraidentifc-lo,localiza-seo18
0
elemento na freqncia
acumulada, neste exemplo 3,
d
M = isto , a mediana igual a 3.
Calcule a mediana da tabela, a seguir:
Tabela 10 Crianas e adolescentes em uma escola
Quando o somatrio das freqncias for par, o valor mediano ser a m-
dia entre os elementos de ordem
2
n
e 1
2
+
n
, ou seja, 4
2
8
= e 5 1
2
8
= + .
Identifcam-seo4
o
e 5
o


elementos na freqncia acumulada, que corres-
pondem, respectivamente, aos elementos 15 e 16. Portanto a mdia dos
elementos a mediana
15 16 31
15, 5
2 2
d
M anos
+
= = = .
Idade (anos) (
i
X ) Frequncia (
i
f ) Frequncia acumulada (
i
fa )
12 1 1
14 2 3
15 1 4
16 2 6
17 1 7
20 1 8
Total 8 -

42 43
COM INTERVALOS DE CLASSE: Neste caso, devemos seguir os
seguintes passos:
1
0
) passo: Determinamos as freqncias simples
i
f ;
2
0
) passo: Calculamos as freqncias acumuladas i
fa
;
3
0
) passo: Marcamos a classe correspondente freqncia acumulada
imediatamente superior a
2
n
. Tal classe ser a classe mediana;
4
0
) passo: Calculamos a Mediana pela seguinte frmula:.
1
2
i
d i i
i
n
fa
M l h
f



= +
onde:
i
i = o limite inferior da classe que contm a mediana;
1 i
fa
= a freqncia acumulada da classe anterior classe mediana;
i
f = a freqncia da classe que contm a mediana;
i
h = a amplitude da classe que contm a mediana.
Tabela 11 Distribuio das estaturas das crianas.
Estaturas
(cm)
Crianas
(
i
f )
Freqncia acumulada
(
i
fa )
50 54 4 4
54 58 9 13
58 62 11 24
62 66 8 32
66 70 5 37
70 74 3 40
Total 40 -

44
1
0
) passo:
20
2
40
2

n

logo a classe mediana ser 58 62.
2
0
) passo:Identifcaodoselementosparacalcularovalordamediana
na frmula:
i
l = 58; 1 i
fa
= 13;
i
f = 11; e
i
h = 4.
Substituindo esses valores na frmula, obtemos:

54 , 60
11
28
58 4
11
13 20
58


d
M





Emprego da Mediana
Quando desejamos obter o ponto que divide a distribuio em duas
partes iguais.
Quando h valores extremos que afetam de maneira acentuada a mdia
aritmtica.
2.9.3 Moda -
o
M
A moda o valor que ocorre com maior freqncia em um
conjunto de dados.
Exemplo: O salrio modal dos empregados de uma fbrica o salrio mais
comum, isto , o salrio recebido pelo maior nmero de empregados dessa
fbrica.
44 45
A MODA PARA DADOS AGRUPADOS:
Moda sem intervalos de classe: Uma vez agrupados os dados,
possveldeterminarimediatamenteamoda:bastafxarovalordavarivel
de maior freqncia.
Quadro 4 Qual a temperatura mais comum medida no ms.
Resposta: a
0
2 M = , isto , a temperatura modal 2 C, pois ocorreu com
maior freqncia.
Moda com intervalos de classe: A classe que apresenta a maior fre-
qnciadenominadaclassemodal.Peladefnio,podemosafrmarque
a moda, neste caso, o valor dominante que est compreendido entre os
limites da classe modal.
Tabela 12 A estatura modal conforme a tabela a seguir.

Temperaturas Dias (f
i
)
0 C 3
1 C 9
2 C 12
3 C 6
Estaturas (cm) Crianas (
i
f )
50 54 4
54 58 9
58 62 11
62 66 8
66 70 5
70 74 3
Total 40

46
Mtodo utilizando a frmula de CZUBER:
i i o
h l M
+

+ =
2 1
1
i
l = limite inferior da classe modal;
1
= a diferena entre a freqncia da classe modal e a freqncia da
classe imediatamente anterior da classe modal;
2
= a diferena entre a freqncia da classe modal e a freqncia da
classe imediatamente posterior da classe modal;
i
h = amplitude da classe modal.
6 , 59 4
) 8 11 )( 9 11 (
9 11
58



o
M
OBS: A moda utilizada quando desejamos obter uma medida rpida e
aproximada de posio ou quando a medida de posio deva ser o valor
mais tpico da distribuio.
2.10 Medidas de disperso ou variabilidade
Para a descrio adequada de um fenmeno, necessitamos da
medida de tendncia central mdia. Utilizamos tambm as medidas de
disperso que representam as oscilaes em torno de um valor central, os
desvios em relao a este valor central.
46 47
2.10.1 Amplitude total
a nica medida de disperso que no tem na mdia o ponto de referncia.
Quando os dados no esto agrupados, a amplitude total a diferena
entre o maior e o menor valor observado:
min max
X X A
t
=
Exemplo: Para os valores 40, 45, 48, 62 e 70. Calcule a amplitude total:
30 40 70
t
A
Quando os dados esto agrupados sem intervalos de classe ainda temos,
como exemplo:
Tabela 13 Dados esto agrupados sem intervalos de classe
t
A =
min max
X X
t
A = 8 12 20
.
COM INTERVALOS DE CLASSE A AMPLITUDE TOTAL - a
diferena entre o limite superior da ltima classe e o limite inferior da
primeira classe.

Idade (
i
X ) Frequncia (
i
f )
12 1
14 2
15 1
16 2
17 1
20 1
Total 8
48
Exemplo:
Tabela 14 Dados de estatura (em cm) agrupados em intervalos de classe
A amplitude total tem o inconveniente de s levar em conta os
dois valores extremos da srie. Faz-se uso da amplitude total quando se
quer determinar a amplitude da temperatura em um dia, no controle de
qualidade ou como uma medida de clculo rpido sem muita exatido.
2.10.2 Varincia (
2
S
)
A varincia uma medida que tem pouca utilidade na estatstica
descritiva, porm extremamente importante na inferncia estatstica e
em combinaes de amostras. Calculada pela soma ao quadrado das dife-
renas das classes.

Estaturas (cm)
Frequncia (
i
f )
50 54
04
54 58 09
58 62
11
62 66 08
66 70
05
70 74 03
Total 40
t
A =
max min
74 50 24 . X X cm

( )
n
f x x
S
i
k
i
i
2
1
2

=

=
ou
1
2
1 1
2
2

|
.
|

\
|

=

= =
n
f x f x
S
k
i
i i i
k
i
i

48 49
2.10.3 Desvio padro ( )
a medida de disperso que geralmente mais empregada, pois
leva em considerao a totalidade dos valores da varivel em estudo.
um indicador de variabilidade bastante estvel. O desvio padro baseia-se
nos desvios em torno da mdia aritmtica e a sua frmula bsica pode ser
traduzida como: a raiz quadrada da mdia aritmtica dos quadrados dos
desvios e representada por .
DESVIO PADRO PARA DADOS NO AGRUPADOS E SEM RE-
PETIES
Para uma amostra:
Exemplo: Dada uma amostra: 2, 3, 4, 5. Calcule o desvio padro.
Soluo: Precisamos calcular a mdia primeiramente.
Exemplo: Calcule o desvio padro populacional para os dados: 3, 6, 12, 7.
Para o clculo do desvio padro populacional, utilizamos a seguinte fr-
mula:
2
S
2
S
1
) (
2
1

n
x x
S
n
i
i


5 , 3
4
14
x

1 4
) 5 , 3 5 ( ) 5 , 3 4 ( ) 5 , 3 3 ( ) 5 , 3 2 (
2 2 2 2


S
3
) 5 , 1 ( ) 5 , 0 ( ) 5 , 0 ( ) 5 , 1 (
2 2 2 2

S
3
25 , 2 25 , 0 25 , 0 25 , 2
S
3
00 , 5
S 67 , 1 S 29 , 1 S

50
N
x x
S
n
i
i
2
1
) (



7
4
28
x

4
) 7 7 ( ) 7 12 ( ) 7 6 ( ) 7 3 (
2 2 2 2

S
4
) 0 ( ) 5 ( ) 1 ( ) 4 (
2 2 2 2

S
4
42
S 5 , 10 S 24 , 3 S


DESVIO PADRO PARA DADOS AGRUPADOS- DISTRIBUIO
DE FREQUNCIA PONTUAL
Utilizando a Tabela abaixo (Tabela 6), calcule o desvio padro.

Idade
(xi)
Alunos
(fi)
xifi xi
2
fi
12 1 12x1= 12 12
2
x1= 144
14 2 14x2= 28 14
2
x2= 392
15 1 15x1= 15 15
2
x1= 225
16 2 16x2= 32 16
2
x2=512
17 1 17x1 = 17 17
2
x1= 289
20 1 20x1 = 20 20
2
x1= 400
Total 8 124 1.962

(
(
(
(
(

|
.
|

\
|

=


=
=
n
i
n
i
i i
i i
n
f x
f x
n
S
1
2
1 2
1
1

( )
(

=
8
124
962 . 1
1 8
1
2
S
| | 40
7
1
= S 71 , 5 = S 39 , 2 = S anos.

50 51
DESVIO PADRO PARA DADOS AGRUPADOS-DISTRIBUIO
EM CLASSES
A seguir, temos a distribuio de frequncia dos tempos de atendimento
(em minutos) de um caixa de banco de uma amostra de 15 clientes.
*No clculo do desvio padro usaremos a mesma frmula anterior, sendo que xi a ser
trabalhado ser o ponto mdio entre cada intervalo, ou seja, o ponto mdio do primeiro
intervalo ser a mdia dos intervalos.
Aplicando a frmula:
2.11 Medidas de disperso relativa
2.12 Coefciente de variao de Pearson -
CV(%)
Na estatstica descritiva o desvio padro por si s tem grandes
limitaes. Assim, um desvio padro de duas unidades pode ser considera-
do pequeno para uma srie de valores cujo valor mdio 200; no entanto,
se a mdia for igual a 20, o mesmo no poderia ser dito. Observa-se o fato
de o desvio padro ser expresso na mesma unidade de medida dos dados.
Por outro lado quando os dados so expressos em unidades dife-
rentes,limita-seoempregodocoefcientedevariao-CV:Coefcientede
Variao de Pearson ( a razo entre o desvio padro e a mdia referente a
dados de uma mesma srie). Medida essa denominada de:
Faixa de tempo Clientes
(fi)
(xi)* xifi xi
2
fi
0 4 3 2 2x3= 6 (2)
2
x3= 12
4 8 7 6 6x7 = 42 (6)
2
x7= 252
8 12 5 10 10x5= 50 (10)
2
x5= 500
Total 8 - 98 764


( )
(

=
15
98
764
1 15
1
2
S | | 73 , 123
14
1
= S 84 , 8 = S 87 , 2 = S minutos.

100
X
S
CV

52
O resultado neste caso expresso em percentual, entretanto pode
ser expresso tambm atravs de um fator decimal, desprezando assim o
valor 100 da frmula.
Exemplo: Tomemos os resultados das estaturas e dos pesos de um mesmo
grupo de indivduos no quadro a seguir:
Quadro 5 Estaturas e pesos de um grupo de indivduos.
Qual das medidas (Estatura ou Peso) possui maior homogeneidade?
Clculo dos Coefcientes de Variao
TeremosquecalcularoscoefcientesdevariaodasvariveisEstaturae
Peso.
O coefcientede menor valor ser o de maior homogeneidade,isto,o
que tem a menor disperso ou variabilidade dos dados.
Estatura:
Peso:
Logo, nesse grupo de indivduos, a varivel estatura apresenta menor grau
de disperso nos dados que a varivel peso.
VARIVEL M D I A DESVIO PADRO
Estatura 175 cm 5,0 cm
Peso 68 kg 2,0 kg

% 85 , 2 100 ) 175 / 5 ( (%) CV
% 94 , 2 100 ) 68 / 2 ( (%) CV
52 53
Exerccio do captulo 2
1) Os dados da tabela abaixo so de ttulos negociados. Calcule o
valor mdio dos ttulos negociados.
2) Observe o nmero de divrcios na cidade, de acordo com a
durao do casamento, na tabela abaixo.
a) Qual a durao mdia e mediana dos casamentos?
b) Encontre a varincia e o desvio padro da durao dos casa-
mentos.
3) A distribuio de freqncia do salrio anual dos moradores do
bairro A que tm alguma forma de rendimento apresentada na tabela a
seguir:
a) Qual a mdia e o desvio padro da varivel salrio?

Valor dos Ttulos (R$) Nmero de Ttulos
2.000 18
500 08
200 02
Total 28

Anos de casamento Nmero de divrcios
0 6
2.800
6 12
1400
1218
600
18 24
150
2430
50
Total 5.000
54
b) Um bairro B apresentou, para a mesma varivel, uma mdia de
7,2 e um desvio padro de 15,1. Em qual dos bairros a populao mais
homognea quanto renda?
4) Uma pesquisa com usurios de transportes coletivos na cidade
X indagou sobre os diferentes tipos usados nas suas locomoes dirias.
Dentre nibus, moto e taxi, o nmero de diferentes meios de transporte
utilizados foi: 2; 3; 2; 1; 2; 1; 2; 1; 2; 3; 1; 1; 1; 2; 2; 3; 1; 1; 1; 1; 2, 1; 1; 2;
2; 1; 2; 1; 2 e 3.
a) Organize uma distribuio de freqncia.
b)Faaumarepresentaogrfca.
c) Calcule todas as medidas de tendncia e variabilidade que voc
conhece.
d) Admitindo que essa amostra represente bem o comportamento
do usurio desta cidade pesquisada, voc acha que a porcentagem dos
usurios que utilizam mais de um tipo de transporte grande?
5) A distribuio de freqncia abaixo indica o nmero de aciden-
tes ocorridos com motoristas de uma empresa de nibus em determinado
ano:
a) Determine a freqncia acumulada absoluta e a freqncia re-
lativa (%);

Faixa salarial Nmero de moradores
0 2
10.000
2 4
3.900
4 6
2.000
6 8
1.100
8 10
800
1012
700
1214
2.000
Total 20.500
54 55
b) Calcule a mdia, mediana e moda;
c) Calcule a amplitude total, varincia, desvio padro.
6) (Bussab e Morettin, 2005) Para facilitar um projeto de ampliao
da rede de esgoto de uma regio de uma cidade, as autoridades tomaram
uma amostra de tamanho 50 dos 270 quarteires que compem a regio, e
foram encontrados os seguintes nmeros de casas por quarteiro:
Quadro 6. Nmero de casas por quarteiro
Faa uma anlise descritiva destes dados:
a) Construa uma distribuio de freqncia mais adequada para estes
dados;
b) Calcule a mdia, mediana e moda;
c) Calcule a amplitude total, varincia e desvio padro.
7) Os dados da tabela abaixo, retirados de Magalhes e Lima (2001),
so informaes de um questionrio aplicado aos alunos do primeiro ano
de uma escola fornecendo as seguintes informaes: Id:identifcaodo
aluno. Turma: turma a que o aluno foi alocado (A ou B). Sexo: F de
feminino, M de masculino. Idade: idade em anos. Alt: altura em metros.
Peso: peso em quilogramas. Filhos:nmerodeflhosnafamlia.Fuma:
hbito de fumar, sim ou no. Toler: tolerncia ao cigarro: (I) indiferente,
(P) incomoda pouco e (M) incomoda muito. Fsica: horas de atividade

2 2 3 10 13 14 15 15 16 16
18 18 20 21 22 22 23 24 25 25
26 27 29 29 30 32 36 42 44 45
45 46 48 52 58 59 61 61 61 65
66 66 68 75 78 80 89 90 92 97


Nmero de Acidentes Nmero de Motoristas
2 16
3 09
4 06
5 05
6 03
Total 39
56
fsica por semana. Cine: nmero de vezes em que vai ao cinema por se-
mana. OpCine: opinio a respeito das salas de cinema na cidade: (B) re-
gular a boa e (M) muito boa. TV: horas gastas assistindo TV por semana.
OpTV: opinio a respeito da qualidade da programao na TV: (R) ruim,
(M) mdia, (B) boa e (N) no sabe. Faa uma anlise descritiva dos dados
apresentados acima.
Id Turma Sexo Idade Alt Peso Filhos Fuma Toler Fsica Cine OpCine TV OpTV
1 A F 17 1,60 60,5 2 NAO P 0 1 B 16 R
2 A F 18 1,69 55,0 1 NAO M 0 1 B 7 R
3 A M 18 1,85 72,8 2 NAO P 5 2 M 15 R
4 A M 25 1,85 80,9 2 NAO P 5 2 B 20 R
5 A F 19 1,58 55,0 1 NAO M 2 2 B 5 R
6 A M 19 1,76 60,0 3 NAO M 2 1 B 2 R
7 A F 20 1,60 58,0 1 NAO P 3 1 B 7 R
8 A F 18 1,64 47,0 1 SIM I 2 2 M 10 R
9 A F 18 1,62 57,8 3 NAO M 3 3 M 12 R
10 A F 17 1,64 58,0 2 NAO M 2 2 M 10 R
11 A F 18 1,72 70,0 1 SIM I 10 2 B 8 N
12 A F 18 1,66 54,0 3 NAO M 0 2 B 0 R
13 A F 21 1,70 58,0 2 NAO M 6 1 M 30 R
14 A M 19 1,78 68,5 1 SIM I 5 1 M 2 N
15 A F 18 1,65 63,5 1 NAO I 4 1 B 10 R
16 A F 19 1,63 47,4 3 NAO P 0 1 B 18 R
17 A F 17 1,82 66,0 1 NAO P 3 1 B 10 N
18 A M 18 1,80 85,2 2 NAO P 3 4 B 10 R
19 A F 20 1,60 54,5 1 NAO P 3 2 B 5 R
20 A F 18 1,68 52,5 3 NAO M 7 2 B 14 M
21 A F 21 1,70 60,0 2 NAO P 8 2 B 5 R
22 A F 18 1,65 58,5 1 NAO M 0 3 B 5 R
23 A F 18 1,57 49,2 1 SIM I 5 4 B 10 R
24 A F 20 1,55 48,0 1 SIM I 0 1 M 28 R
25 A F 20 1,69 51,6 2 NAO P 8 5 M 4 N
26 A F 19 1,54 57,0 2 NAO I 6 2 B 5 R
27 B F 23 1,62 63,0 2 NAO M 8 2 M 5 R
28 B F 18 1,62 52,0 1 NAO P 1 1 M 10 R
29 B F 18 1,57 49,0 2 NAO P 3 1 B 12 R
30 B F 25 1,65 59,0 4 NAO M 1 2 M 2 R
31 B F 18 1,61 52,0 1 NAO P 2 2 M 6 N
32 B M 17 1,71 73,0 1 NAO P 1 1 B 20 R
33 B F 17 1,65 56,0 3 NAO M 2 1 B 14 R
34 B F 17 1,67 58,0 1 NAO M 4 2 B 10 R
35 B M 18 1,73 87,0 1 NAO M 7 1 B 25 B
36 B F 18 1,60 47,0 1 NAO P 5 1 M 14 R
37 B M 17 1,70 95,0 1 NAO P 10 2 M 12 N
38 B M 21 1,85 84,0 1 SIM I 6 4 B 10 R
39 B F 18 1,70 60,0 1 NAO P 5 2 B 12 R
40 B M 18 1,73 73,0 1 NAO M 4 1 B 2 R
41 B F 17 1,70 55,0 1 NAO I 5 4 B 10 B
42 B F 23 1,45 44,0 2 NAO M 2 2 B 25 R
43 B M 24 1,76 75,0 2 NAO I 7 0 M 14 N
44 B F 18 1,68 55,0 1 NAO P 5 1 B 8 R
45 B F 18 1,55 49,0 1 NAO M 0 1 M 10 R
46 B F 19 1,70 50,0 7 NAO M 0 1 B 8 R
47 B F 19 1,55 54,5 2 NAO M 4 3 B 3 R
48 B F 18 1,60 50,0 1 NAO P 2 1 B 5 R
49 B M 17 1,80 71,0 1 NAO P 7 0 M 14 R
50 B M 18 1,83 86,0 1 NAO P 7 0 M 20 B
56 57
Id Turma Sexo Idade Alt Peso Filhos Fuma Toler Fsica Cine OpCine TV OpTV
1 A F 17 1,60 60,5 2 NAO P 0 1 B 16 R
2 A F 18 1,69 55,0 1 NAO M 0 1 B 7 R
3 A M 18 1,85 72,8 2 NAO P 5 2 M 15 R
4 A M 25 1,85 80,9 2 NAO P 5 2 B 20 R
5 A F 19 1,58 55,0 1 NAO M 2 2 B 5 R
6 A M 19 1,76 60,0 3 NAO M 2 1 B 2 R
7 A F 20 1,60 58,0 1 NAO P 3 1 B 7 R
8 A F 18 1,64 47,0 1 SIM I 2 2 M 10 R
9 A F 18 1,62 57,8 3 NAO M 3 3 M 12 R
10 A F 17 1,64 58,0 2 NAO M 2 2 M 10 R
11 A F 18 1,72 70,0 1 SIM I 10 2 B 8 N
12 A F 18 1,66 54,0 3 NAO M 0 2 B 0 R
13 A F 21 1,70 58,0 2 NAO M 6 1 M 30 R
14 A M 19 1,78 68,5 1 SIM I 5 1 M 2 N
15 A F 18 1,65 63,5 1 NAO I 4 1 B 10 R
16 A F 19 1,63 47,4 3 NAO P 0 1 B 18 R
17 A F 17 1,82 66,0 1 NAO P 3 1 B 10 N
18 A M 18 1,80 85,2 2 NAO P 3 4 B 10 R
19 A F 20 1,60 54,5 1 NAO P 3 2 B 5 R
20 A F 18 1,68 52,5 3 NAO M 7 2 B 14 M
21 A F 21 1,70 60,0 2 NAO P 8 2 B 5 R
22 A F 18 1,65 58,5 1 NAO M 0 3 B 5 R
23 A F 18 1,57 49,2 1 SIM I 5 4 B 10 R
24 A F 20 1,55 48,0 1 SIM I 0 1 M 28 R
25 A F 20 1,69 51,6 2 NAO P 8 5 M 4 N
26 A F 19 1,54 57,0 2 NAO I 6 2 B 5 R
27 B F 23 1,62 63,0 2 NAO M 8 2 M 5 R
28 B F 18 1,62 52,0 1 NAO P 1 1 M 10 R
29 B F 18 1,57 49,0 2 NAO P 3 1 B 12 R
30 B F 25 1,65 59,0 4 NAO M 1 2 M 2 R
31 B F 18 1,61 52,0 1 NAO P 2 2 M 6 N
32 B M 17 1,71 73,0 1 NAO P 1 1 B 20 R
33 B F 17 1,65 56,0 3 NAO M 2 1 B 14 R
34 B F 17 1,67 58,0 1 NAO M 4 2 B 10 R
35 B M 18 1,73 87,0 1 NAO M 7 1 B 25 B
36 B F 18 1,60 47,0 1 NAO P 5 1 M 14 R
37 B M 17 1,70 95,0 1 NAO P 10 2 M 12 N
38 B M 21 1,85 84,0 1 SIM I 6 4 B 10 R
39 B F 18 1,70 60,0 1 NAO P 5 2 B 12 R
40 B M 18 1,73 73,0 1 NAO M 4 1 B 2 R
41 B F 17 1,70 55,0 1 NAO I 5 4 B 10 B
42 B F 23 1,45 44,0 2 NAO M 2 2 B 25 R
43 B M 24 1,76 75,0 2 NAO I 7 0 M 14 N
44 B F 18 1,68 55,0 1 NAO P 5 1 B 8 R
45 B F 18 1,55 49,0 1 NAO M 0 1 M 10 R
46 B F 19 1,70 50,0 7 NAO M 0 1 B 8 R
47 B F 19 1,55 54,5 2 NAO M 4 3 B 3 R
48 B F 18 1,60 50,0 1 NAO P 2 1 B 5 R
49 B M 17 1,80 71,0 1 NAO P 7 0 M 14 R
50 B M 18 1,83 86,0 1 NAO P 7 0 M 20 B
8) Um rgo do governo do estado (Bussab e Morettin, 2005) est inte-
ressado em determinar padres sobre o investimento em educao, por
habitante, realizado pelas prefeituras. De um levantamento de dez cidades,
foramobtidososvalores(codifcados)databelaabaixo:
Nessecaso,serconsideradacomoinvestimentobsicoamdiafnaldas
observaes, calculada da seguinte maneira:
a) Obtm-se uma mdia inicial.
b) Eliminam-se do conjunto aquelas observaes que forem su-
periores mdia inicial mais duas vezes o desvio padro, ou inferiores
mdia inicial menos duas vezes o desvio padro.
c)Calcula-seamdiafnalcomonovoconjuntodeobservaes.
d) Qual o investimento bsico que voc daria como resposta?

Cidades A B C D E F G H I J
Investimento 20 16 14 8 19 15 14 16 19 18
58
58 59
Captulo 3 Correlao
Em muitos estudos, o principal objetivo descrever a associao
existente entre as variveis, isto , avaliar o grau de dependncia entre elas,
de modo a prever o resultado mais aproximado de uma delas quando se
conhece a realizao da outra. Para verifcar se existe relao entre duas
variveisquantitativas,ocoefcientedecorrelaoumamedidaadequa-
da.Usualmente,devemosdeterminarocoefcientedecorrelaoparauma
amostra, pois desconhecemos este valor na populao. Um procedimento
bastantetilparaseverifcaraassociaoentrevariveisquantitativas,
por meio do diagrama de disperso.
3.1 Diagrama de Disperso
No estudo da relao entre duas variveis, o diagrama de disper-
so representa um importante passo preliminar antes da anlise estatstica
formal. O diagrama de disperso dos dados permite dar uma idia, da
relao existente, entre as variveis. Para fazer o grfco de disperso,
representa-se cada ponto pelo par de valores X (abscissa) e Y (ordenada)
num sistema cartesiano. Na Figura 1 esto representados os pares ) , ( Y X
observados na Tabela 17.
60

Diagrama de Disperso
0
0.5
1
1.5
2
2.5
3
0 10 20 30 40
Figura 1 Diagrama de disperso da quantidade de nicotina e alcatro em cigarros.
Tabela 15 Quantidades de nicotina e alcatro em 12 marcas de cigarros.
Observao Alcatro em mg ( X ) Nicotina em mg ( Y )
1 1 0,1
2 3 0,3
3 6 0,3
4 9 0,6
5 12 0,9
6 15 0,5
7 18 1,3
8 21 1,4
9 24 1,6
10 28 1,7
11 30 2,1
12 35 2,4

60 61
Figura 2 Representao da correlao positiva.
3.2 Correlao linear
Observada uma associao entre as variveis quantitativas X e Y ,
muitotilquantifcarestaassociao.Apresentaremosaseguirotipode
associao mais simples a linear.
Verifcadapormeiodanuvemdepontoestabelecidapelodiagrama
dedisperso,vamosencontrarumamedidaquepossaquantifcaroquanto
ogrfcoseaproximadeumareta.Estaquantifcaoconhecidacomoo
coefciente de correlao linear e ser denotado por r .
Quando duas variveis crescem no mesmo sentido, dizemos que en-
tre elas existe uma correlao positiva.
Quando duas variveis crescem em sentidos opostos, dizemos que
entre elas existe uma correlao negativa.

62
3.3 Como se mede correlao linear?
Para medir o grau de correlao linear entre duas variveis, calcula-
-seocoefcientedecorrelao r .
Dada uma amostra de um par de variveis ( , ), 1, 2, ,
i i
X Y i n =
ocoefcientedecorrelaoentreasvariveiscalculadocomosegue:
Exemplo: No estudo de cigarros da Tabela 15, com uma amostra de ta-
manho 12 n = marcas de cigarros, foram avaliadas: variveis Nicotina (Y )
e Alcatro ( X ), encontrando os seguintes valores:

Figura 3 Representao da correlao negativa.
( )( )
( ) ( )
1 1
1
2 2
2 2 1 1
1 1
n n
i i
n
i i
i i
i
n n
i i
n n
i i
i i
i i
X Y
X Y
n
r
X Y
X Y
n n
= =
=
= =
= =


=
( (

( (
( (
( (
( (


62 63
Neste caso temos
Ocoefcientedecorrelaovariaentre1e+1,ouseja,.
A relao mais prxima de uma reta, medida que r se aproxima de 1
ou +1. A relao ser uma reta perfeita se .
3.4 Teste de signifcncia sobre r.
Muitas vezes, temos o interesse em testar a existncia de corre-
lao entre duas variveis X e Y , a partir de uma amostra. Neste caso,
alm de mensurar o grau de correlao observado nos dados, queremos,
tambm, testar as seguintes hipteses relativas populao em estudo.
0
H : As variveis X e Y so no correlacionadas;
1
H : As variveis X e Y so correlacionadas.
Ou equivalentemente,
0
: 0 H = versus 0 :
1
H
Supondo que a amostra vem de uma populao com correlao nula, a
estatstica de teste,
tem distribuio -Student com graus de liberdade. Para o exemplo
acima encontramos

12
1
312, 30
i i
i
X Y


,
12
1
202
i
i
X


,
12
2
1
4746
i
i
X


,
12
1
13, 20
i
i
Y


e
12
2
1
20,88
i
i
Y


.

2 2
202 13, 2
312,30
90,10
12
0,9739
92,51
(202) (13, 2)
4746 20,88
12 12
r

= = =
( (

( (


1 1 r
1 r ou 1 r
2
2
1
c
n
t r
r


64
2
12 2
0, 9739 13, 569
1 (0, 9739)
c
t


Eagora,comovamosdecidirseexistecorrelaosignifcativaen-
tre alcatro e nicotina? A regra de deciso depende da hiptese alternativa
e apresentada na Tabela B.
Tabela 16 Regra de deciso sob a hiptese nula
Continuando nosso exemplo, consultando a Tabela B, em anexo,
da distribuio t -Student, encontra-se o grau de liberdade, com 2 10 n =
e / 2 0, 025 = ,
10,2,5%
2, 228 t = . Comparando com o valor obtido da es-
tatstica 13, 569
c
t = , devemos rejeitar a hiptese nula, pois
(10; 2,5%) c
t t >
ou seja, existe uma correlao positiva entre nicotina e alcatro ao nvel de
5% de probabilidade.
Hipteses Regra de deciso:
0 :
0
H No Rejeito
0
H se, e somente se,
( 2, ) n
t t


1
: 0 H
Rej eito
0
H se, e somente se,
( 2; )
2
| |
n
t t



64 65
Exerccio
1. O primeiro estudo de regresso foi realizado por Galton, por volta de
1885. O problema que gerou este estudo consistia em compreender se
existiarelaoentreaalturadosflhos(Y)emfunodaalturamdiados
pais (X) medidas em centmetros.
a) Faa o diagrama de disperso;
b) Calcule a correlao;
c) Teste a correlao 0, 05 = ;
d) Conclua.
X Y X Y X Y X Y
164 166 164 168 166 166 166 168
166 171 166 173 169 166 169 168
169 171 169 173 171 166 171 168
171 171 171 173 171 176 173 168
173 171 173 176 173 178 176 171
176 173 176 176 178 176 178 178

66
66 67
Captulo 4 Regresso linear simples
4.1 Introduo
No estudo de regresso linear simples, o objetivo construir um
modelo estatstico que possa ser utilizado para prever os valores da vari-
vel resposta ou varivel dependente Y , com base nos valores da varivel
regressora ou varivel independente X . O modelo de regresso linear
dito simples, porque utiliza apenas uma varivel independente.
O primeiro passo, na anlise, construir o diagrama de disperso.
Ele ajuda na escolha da forma relacional entre as variveis. Essa relao
pode ser descrita por uma funo linear ou por uma funo linearizvel.
4.2 Modelo Estatstico
Assumimos que cada resposta
i
Y est relacionada com o valor
i
X
da varivel independente por meio da equao:
onde:
(1)
1 2,
, ,
n
X X X so os valores da varivel controlada X , que o
experimentador selecionou para o estudo.
(2)
1 2
, , ,
n
, so erros desconhecidos que afetam a verdadeira
relao linear. So variveis aleatrias no observveis, as quais
assumimos serem independentes, normalmente distribudas com
mdia zero e varincia constante
2
, constante e desconhecida,
isto
2
(0, )
i
N .
(3)
e so parmetros desconhecidos e devem ser estimados a
, 1, 2, ,
i i i
Y X i n
68
partir dos dados. e representam o intercepto e a inclinao
da reta, respectivamente.
4.3 O mtodo dos Mnimos Quadrados
Este mtodo consiste em determinar os valores dos parmetros e
queminimizamasomadosquadradosdoserros,aqualdefnidapor:
onde a e b sochamadosdeestimadoresdemnimosquadradosdeeb,
respectivamente.
4.4 Notao bsica
4.5 Reta de Mnimos Quadrados
Com a notao acima e usando resultados do clculo, encontra-
mos, para a e b , o seguinte resultado, respectivamente:
A reta de regresso ou de mnimos quadrados dada ento por:
2 2
1 1

( ) ( )
n n
i i i i
i i
SQE Y Y Y a bX




1
1
n
i
i
X X
n

1
1
n
i
i
Y Y
n

1 1
cov( , ) ( )( )
n n
i i i i
i i
X Y X X Y Y X Y nXY




2
2
2 2
1 1
( )
n n
X i i
i i
S X X X nX




2
2
2 2
1 1
( )
n n
Y i i
i i
S Y Y Y nY





X b Y a e
2
cov( , )
X
X Y
b
S
.

, 1, 2, ,
i i
Y a bX i n
68 69
Exemplo
Para os dados de nicotina e alcatro, vamos determinar a reta de
regresso para descrever a quantidade de Nicotina em funo da quanti-
dade de Alcatro. A tabela 17 auxilia os clculos:
Tabela 17 Clculos para anlise de regresso: Nicotinas (Y) e Alcatro (X) em mg.
Neste caso encontramos,
i
i
X
i
Y
2
i
X
2
i
Y
i i
X Y
1 1 0,1 1 0,01 0,1
2 3 0,3 9 0,09 0,9
3 6 0,3 36 0,09 1,8
4 9 0,6 81 0,36 5,4
5 12 0,9 144 0,81 10,8
6 15 0,5 225 0,25 7,5
7 18 1,3 324 1,69 23,4
8 21 1,4 441 1,96 29,4
9 24 1,6 576 2,56 38,4
10 28 1,7 784 2,89 47,6
11 30 2,1 900 4,41 63,0
12 35 2,4 1225 5,76 84,0
Total 202 13,2 4746 20,88 312,3

1
1 202
16,83
12
n
i
i
X X
n =
= = = e
1
1 13, 2
1,10
12
n
i
i
Y Y
n =
= = = .
2
2 2 2
1
47416 12 (16,83) 1347, 01
n
X i
i
S X nX
=
= = =
Ou
2
2 2
1 1
/ 1347, 01
i
n n
X i
i i
S X X n
= =
| |
= =
|
\ .


2
2 2 2
1
20,88 12 (1,10) 6, 36
n
Y i
i
S Y nY
=
= = = ou
2
2 2
1 1
/ 6, 36
i
n n
Y i
i i
S Y Y n
= =
| |
= =
|
\ .


1 1
( )( ) 312, 30 12 16,83 1,10 90,14
n n
XY i i i i
i i
S X X Y Y X Y nXY
= =
= = = = ou
1 1 1
cov( , ) / 90,14
n n n
i i i i
i i i
X Y X Y X Y n
= = =
| || |
= =
| |
\ .\ .


70
As estimativas dos parmetros so dadas por
Portanto, o modelo estimado por:
O modelo estima que, quando aumenta 1mg de alcatro, aumenta 0,0669mg
de nicotina.
Figura 4 Representao da reta de regresso e dos pontos observados.
4.6 Anlise de Varincia
Uma vez estimada a reta de regresso, devemos verifcar se ela
representa satisfatoriamente a relao entre as variveis em estudo, cuja
tendncia foi observada pelo conjunto de dados.
Desse modo, necessrio conhecer o resduo
i i i
Y Y e

= que es-
2
90,14
0, 0669
1347, 01
XY
X
S
b
S
ou
2
cov( , )
0, 0669
x
X Y
b
S

e 1,10 0, 0669 16,83 0, 0262 a Y bX .

0, 0262 0, 0669 1, 2, ,12.
i i
Y X i
35 30 25 20 15 10 5 0
3
2
1
0
X
Y
R-Sq = 94,9 %
Y = -0,0262 + 0,0669X
95% PI
95% CI
Regresso


70 71
crito como a diferena entre o valor observado e o valor estimado e pode
ser escrito como:
Elevando-se o resduo ao quadrado e somando-se, depois de al-
guns clculos temos:
Para desenvolver a tabela de anlise de varincia, conhecida como
ANOVA, apresenta-se a seguir como encontrar, os clculos de somas de
quadrados,aseguirosclculosdequadradosmdiose,fnalmente,aesta-
tstica F calculada.
4.7 Como encontrar as somas de
quadrados?
A soma de quadrado total pode ser calculada por:
)

( ) ( )

(
i i i i i i i
Y Y Y Y Y Y e




n
i
i i
n
i
i i
n
i
i i
Y Y Y Y Y Y
1
2
1
2
1
2
)

( ) ( )

( ,
ou seja,
(Total) (Regresso) (Resduo) SQ SQ SQ
(Total) SQ a soma de quadrados total
(Regresso) SQ a soma de quadrados devido regresso
(Resduo) SQ a soma dos quadrados dos resduos.


2 2 2
1 1
(Total) ( )
n n
i i
i i
SQ Y Y Y nY
= =
= =

ou
2
2
1 1
(Total) /
i
n n
i
i i
SQ Y Y n
= =
| |
=
|
\ .

.

72
A soma de quadrado de regresso pode ser calculada por:
De modo que a soma de quadrado do resduo dada pela diferen-
a entre a soma de quadrado total e a soma de quadrado de regresso:
4.8 Como encontrar os quadrados
mdios?
Iniciaremos encontrando os graus de liberdade (gl):
Para estabelecer os graus de liberdade associados s somas de qua-
drados, precisamos levar em conta as estimativas envolvidas em sua ex-
presses. Assim, ( ) SQ Total envolve Y , e assim, temos 1 n graus de
liberdade associados a essa quantidade; (Re ) SQ sduo envolve duas esti-
mativas,

, de forma que teremos 2 n graus de liberdade. Para a


(Re ) SQ gresso , restam 1 ( 2) 1 n n = grau de liberdade.
Os quadrados mdios de Regresso so encontrados dividindo a
soma de quadrados de Regresso pelos seus respectivos graus de liberda-
de.
(Regresso)
(Regresso)
(Regresso)
SQ
QM
gl
=

2 2
1 1

(Regresso) ( ) [ ( ) ]
n n
i
i i
SQ Y Y Y b X X Y
= =
= = +


ou
2
1 1
1
2
2
1 1
(Regresso)
i
n n
i i
n
i i
i i
i
n n
i
i i
X Y
X Y
n
SQ
X X
n
= =
=
= =
| | | || |
| | |
\ .\ .
|

|
|
\ .
=
| |

|
\ .


.

(Resduo) (Total) (Regresso) SQ SQ SQ
72 73
Os quadrados mdios de Resduos so encontrados dividindo a
soma de quadrados de Resduos pelos seus respectivos graus de liberdade.
Portanto o quadrado mdio :

4.9 O teste F
O teste F determinado pelo clculo da estatstica
c
F , defni-
da pela razo de duas distribuies qui-quadrados, (Regresso) QM e
(Resduo) QM ;
(Regresso)
(Resduo)
c
QM
F
QM
=
Portanto, essa decomposio resumida na tabela de Anlise de
Varincia ANOVA, Tabela 18 apresentada a seguir:
Para o exemplo anterior, vamos determinar e substituir os valores
calculados na tabela de anlise de varincia - ANOVA:
(Resduo)
(Resduo)
(Resduo)
SQ
QM
gl

Causa de Variao
Graus de
Liberdade
Soma de
Quadrados
Quadrado Mdio F
Regresso
1
2 2
X
b S
2 2
X
b S
(Regresso)
(Resduo)
QM
QM

Resduo 2 n
2 2 2
Y
X
S b S
2 2 2
2
Y
X
S b S
n



Total 1 n
2
Y
S

74
2
2 2
1
(Total) 20,88 12 (1,10) 6, 36
n
yy i
i
SQ S Y nY



2
2 2 2
1
(Regresso) (0, 0669) 1347, 01 6, 03
n
xx i
i
SQ b S X nX


,
(Resduo) (Total) (Regresso) 6,36 6, 03 0,33 SQ SQ SQ
Tabela 19 Tabela de Anlise de Varincia
Com base no anexo B, Tabela de Distribuio de F de Snedecor
encontra o valor
(1; 2; ) n
F

, onde o nmero de varivel independente ape-
nas 1 varivel independente (varivel alcatro) no modelo e o nmero de
graus de liberdade do resduo ou erro, que 1 n , onde n o nmero de
pares das variveis . X e Y
(1; 2; )
4, 96,
c n
F F

= logo podemos expressar
o modelo linear 0, 0271 0, 0670
i i
Y X = + .
4. 10 Coefciente de Determinao
OCoefcientedeDeterminao,
2
R , uma medida da qualidade
do ajuste do modelo e mede a proporo da variao de Y que explicada
Causa de
Variao
Graus de
Liberdade
Soma de
Quadrado
Quadrado Mdio Fc

F
Regresso
1
6, 03 6, 030 182, 73 0,0001
Resduo
10 0, 33 0, 033
Total
11
6, 36

: 0
: 0
o
a
H
H


; 1 ; 1
, Re

n c o
F F quando H jeito


74 75
pelo modelo ajustado. O coefciente de determinao uma medida de
adequao do modelo e indica como os dados esto sendo explicados pelo
modelo adotado. expresso em percentagem e calculado por

2
(Regresso)
100
(Total)
SQ
R
SQ
= .
Portanto o coefciente de determinao varia no intervalo de
2
0 100 R . Quanto mais prximo de 100%, melhor ser o modelo
para explicar a relao entre as variveis em estudo. Com base nos dados
da tabela ANOVA anterior, encontramos

Assim, 94,81% da variao de Y explicada pela reta de regres-
so, o que indica que estamos com um modelo razovel para descrever a
relao entre as variveis nicotina e alcatro.
4.11 Inferncia sobre os parmetros
2
6, 03
100 0, 9481 100 94,81%
6, 36
R
4.1
(1) Os estimadores de mnimos quadrados so no viciados:
( ) E a o = e ( ) E b | =
(2)
2
2
1
( )
xx
X
Var a
n S
o
| |
| = +
|
\ .
e
2
( )
xx
Var b
S
o
=
(3) As distribuies de a e b so normais com mdias o e | , respectivamente, e varincias
dadas em (2).
(4)
2
(Resduo)
2
SQ
s
n
=

um estimador no viciado de
2
o . Tambm
2
2
( 2) n s
o


tem
distribuio qui-quadrado com 2 n graus de liberdade e independente de a e b .
(5) O erro padro estimado de a
2
1
( )
xx
X
s a s
n S
= +
(6) O erro padro estimado de b ( )
xx
s
s b
S
=
(7)
( )
xx
S b
s
|
tem distribuio t Student com 2 n graus de liberdade
(8)
2
2
( )
1
xx
a
X
s
n S
o
| |
| +
|
\ .
tem distribuio t Student com 2 n graus de liberdade.

76
4.1
(1) Os estimadores de mnimos quadrados so no viciados:
( ) E a o = e ( ) E b | =
(2)
2
2
1
( )
xx
X
Var a
n S
o
| |
| = +
|
\ .
e
2
( )
xx
Var b
S
o
=
(3) As distribuies de a e b so normais com mdias o e | , respectivamente, e varincias
dadas em (2).
(4)
2
(Resduo)
2
SQ
s
n
=

um estimador no viciado de
2
o . Tambm
2
2
( 2) n s
o


tem
distribuio qui-quadrado com 2 n graus de liberdade e independente de a e b .
(5) O erro padro estimado de a
2
1
( )
xx
X
s a s
n S
= +
(6) O erro padro estimado de b ( )
xx
s
s b
S
=
(7)
( )
xx
S b
s
|
tem distribuio t Student com 2 n graus de liberdade
(8)
2
2
( )
1
xx
a
X
s
n S
o
| |
| +
|
\ .
tem distribuio t Student com 2 n graus de liberdade.

Quadro7Estimaodoscoefcientesderegresso.
4.12 Observaes sobre o modelo:
A relao entre e linear nos parmetros;


Coeficiente

Estimativa

Desvio padro

t

P

-0,02709 0,09808 -0,28 0,788
0,066956 0,004932 13,58

0,000

0,1809


(a) erros
1 2
, , ,
n
so independentes;
(b) Os erros tm mdia zero e varincia constante;
(c) A distribuio dos erros normal, ou seja, n i N
i
, , 2 , 1 ), , 0 ( ~
2
.

76 77
4.13 Anlise dos Resduos
O resduo,
i
e , defnido como sendo a diferena entre o valor
realmente observado e o valor estimado pela reta de regresso, ou seja,

i i i
e Y Y = , a parte que o modelo estimado no foi capaz de explicar.
As observaes realizadas anteriormente sobre o modelo so, na
realidade, pressuposies feitas sobre o modelo de regresso populacio-
nal,quedevemserverifcadasatravsdaanlisedosresduos,paraqueo
modelo estimado tenha validade.
Tabela 20 Anlise dos resduos, em funo da estimao da nicotina e o valor observado.
Essaverifcaofeitaatravsdaanlisedosresduoseaprincipal
ferramentaparaestaanliseogrfcodosresduosversus valores ajusta-
dos,

i i
e Y . Se o modelo adequado para os dados, o grfco no deve
apresentar tendncia, seu comportamento deve ser bastante aleatrio,
apresentando uma faixa ao longo do eixo dos X .
i
i
X
i
Y

i
Y
i
e
1 1 0,1 0,03987 0,060131
2 3 0,3 0,17378 0,126220
3 6 0,3 0,37465 -0,074647
4 9 0,6 0,57551 0,024486
5 12 0,9 0,77638 0,123619
6 15 0,5 0,97725 -0,477248
7 18 1,3 1,17811 0,121885
8 21 1,4 1,37898 0,021018
9 24 1,6 1,57985 0,020151
10 28 1,7 1,84767 -0,147672
11 30 2,1 1,98158 0,118417
12 35 2,4 2,31636 0,083639

78
0 1 2
-0,5
-0,4
-0,3
-0,2
-0,1
0,0
0,1
Ajustado
R
e
s

d
u
o

R
e
s

d
u
o
Figura 5 Representao do resduo em funo dos dados ajustados.
78 79
Exerccio do captulo 4
1) Foram medidos colesterol srio (mg/100 ml) e deposio arterial de
clcio (mg/100g), em 12 animais. Os dados esto apresentados a seguir:
a) Formule hipteses;
b) Calcule a correlao, teste e interprete;
c) Se existe a correlao, estime a e b;
d) Estime o modelo de regresso linear simples Y
i
= a + X
i
e) Estime o colesterol, para clcio igual 60;
f) Interprete os dados.
2) Complete o quadro de anlise de varincia (ANOVA) com base nos
dados do exerccio anterior.
Clcio (X) Colesterol (Y)
59 298
52 303
42 233
59 287
24 236
24 245
40 265
32 233
63 286
57 290
36 264
24 236

80
Causa de Variao
Graus de
Liberdade
Soma de
Quadrado
Quadrado Mdio Fc
Regresso
Resduo
Total

3)CalculeoCoefcientedeDeterminao;
4) Encontre

i
Y e
i
e com base no modelo do exerccio 1. Construa e
analiseogrfco
i i
e y e conclua.
80 81
Referncias
BARBETTA, Pedro Alberto A. Estatstica Aplicada s Cincias So-
ciais. 5
a
ed. Florianpolis, SC: Editora da UFSC. 340 p. 2002.
BHATTACHARRYYA, Gouri K.; JOHNSON, Richard A.. Statistical
concepts and methods. Canad: Jonh Wiley & Sons, Inc. 639p. 1977.
BRAULE, Ricardo. Estatstica aplicada com Excel: para cursos de
Administrao e economia. Rio de Janeiro: Esevier, 2001.
BOLFARINE, Heleno; BUSSAB, Wilton de Oliveira. Elementos de
Amostragem. So Paulo: Editora Edgard Blcher. 274 p. 2005.
BUSSAB, Wilton de Oliveira e MORETTIN, Pedro Alberto. Estatstica
Bsica. 5
a
edio. So Paulo, SP: Atlas. 2005.
COSTA, Suely de Souza; CARDOSO NETO, Jos e NASCIMENTO,
Sonia Arajo. Metodologia Quantitativa Aplicada s Cincias So-
ciais. Manaus, AM: UEA 2006.
COSTA, Srgio Francisco. Introduo Ilustrada estatstica. 4
a
ed. So
Paulo: Harbra, 2005.
FARIAS, Alfredo Alves; SOARES, Jos Francisco e CSAR, Cibele Co-
mini. Introduo Estatstica. 2
a
edio. Rio de Janeiro: LTC, 1998.
HOFFMANN, Rodolfo. Estatstica para economistas. 4
a
ed. So Paulo:
Pioneira, 2006.
MAGALHES, Marcos Nascimento; LIMA, Antonio Carlos Pedroso.
Noes de probabilidade e estatstica 4
a
ed. So Paulo: EDUSP, 2002.
MARTINS, Gilberto de Andrade. Estatstica Geral e Aplicada. 3
a
ed.
So Paulo: Atlas, 2005.
NAZARETH, Helenalda Resende de Souza. Curso bsico de estatsti-
ca. 12
a
ed. So Paulo: tica, 160p. 2001.
NEDER, Henrique Dantas. Amostragens em pesquisas socioecon-
micas. Campinas/So Paulo: Alnea, 108 p. 2008.
OLIVEIRA, Francisco Estevam Martins. Estatstica e Probabilidade.
2
a
ed. So Paulo: Atlas, 1999.
PEREIRA, Jlio Csar. Anlise de dados quantitativos: Estratgias
metodolgicas para as cincias da sade e sociais. 2
a
ed. So Paulo:
EDUSP, 154p. 1999.
82
SILVA, Elio Medeiros; GONALVES, Valter; SILVA, Ermes Medeiros
e MUROLO, Afrnio Carlos. ESTATSTICA para cursos de: Econo-
mia, Administrao e Cincias Contbeis. Volume 1. So Paulo, SP:
Atlas. 1995.
SILVA, Nilza Nunes. Amostragem Probabilstica. 2
a
ed. So Paulo, SP:
Edusp, 120 p. 2001.
TIBONI, Conceio Gentil Rebelo. Estatstica Bsica para o curso de
Turismo. 2
a
ed. So Paulo: Atlas, 236p. 2003.
TOLEDO, G. L. e Ovalle, I. I. Estatstica Bsica. 2
a
ed. So Paulo: Atlas,
1991.
TRIVINS, Augusto Nibaldo Silva. Introduo pesquisa em Cin-
cias Sociais. 1
a
edio. So Paulo: Atlas. 175p. 1987.
VIEIRA, Sonia. Princpios de Estatstica. 1
a
ed. So Paulo: Pioneira
Thomson Learning, 144p. 2003.
WONNACOTT, T. H. and WONNACOTT, R. J. Introductory Statis-
tics. Fifth Ed. New York: John Wiley & Sons, 1990.
82 83
ANEXO
Tabela de Estatstica A - Distribuio Normal Padro - ( ) P Z z p =

Tabela de Estatstica A - Distribuio Normal Padro - ( ) P Z z p
z
p

z

p

z

p

z

p

z

p

z

p

z

p

z

p

z

p

z

p

0.00 0.500000 0.45 0.673645 0.90 0.815940 1.35 0.911492 1.51 0.934478 1.96 0.975002 2.41 0.992024 2.60 0.995339 3.05 0.998856 3.50 0.999767
0.01 0.503989 0.46 0.677242 0.91 0.818589 1.36 0.913085 1.52 0.935745 1.97 0.975581 2.42 0.992240 2.61 0.995473 3.06 0.998893 3.51 0.999776
0.02 0.507978 0.47 0.680822 0.92 0.821214 1.37 0.914657 1.53 0.936992 1.98 0.976148 2.43 0.992451 2.62 0.995604 3.07 0.998930 3.52 0.999784
0.03 0.511966 0.48 0.684386 0.93 0.823814 1.38 0.916207 1.54 0.938220 1.99 0.976705 2.44 0.992656 2.63 0.995731 3.08 0.998965 3.53 0.999792
0.04 0.515953 0.49 0.687933 0.94 0.826391 1.39 0.917736 1.55 0.939429 2.00 0.977250 2.45 0.992857 2.64 0.995855 3.09 0.998999 3.54 0.999800
0.05 0.519939 0.50 0.691462 0.95 0.828944 1.40 0.919243 1.56 0.940620 2.01 0.977784 2.46 0.993053 2.65 0.995975 3.10 0.999032 3.55 0.999807
0.06 0.523922 0.51 0.694974 0.96 0.831472 1.41 0.920730 1.57 0.941792 2.02 0.978308 2.47 0.993244 2.66 0.996093 3.11 0.999065 3.56 0.999815
0.07 0.527903 0.52 0.698468 0.97 0.833977 1.42 0.922196 1.58 0.942947 2.03 0.978822 2.48 0.993431 2.67 0.996207 3.12 0.999096 3.57 0.999822
0.08 0.531881 0.53 0.701944 0.98 0.836457 1.43 0.923641 1.59 0.944083 2.04 0.979325 2.49 0.993613 2.68 0.996319 3.13 0.999126 3.58 0.999828
0.09 0.535856 0.54 0.705401 0.99 0.838913 1.44 0.925066 1.60 0.945201 2.05 0.979818 2.45 0.992857 2.69 0.996427 3.14 0.999155 3.59 0.999835
0.10 0.539828 0.55 0.708840 1.00 0.841345 1.45 0.926471 1.61 0.946301 2.06 0.980301 2.46 0.993053 2.70 0.996533 3.15 0.999184 3.60 0.999841
0.11 0.543795 0.56 0.712260 1.01 0.843752 1.46 0.927855 1.62 0.947384 2.07 0.980774 2.47 0.993244 2.71 0.996636 3.16 0.999211 3.61 0.999847
0.12 0.547758 0.57 0.715661 1.02 0.846136 1.47 0.929219 1.63 0.948449 2.08 0.981237 2.48 0.993431 2.72 0.996736 3.17 0.999238 3.62 0.999853
0.13 0.551717 0.58 0.719043 1.03 0.848495 1.48 0.930563 1.64 0.949497 2.09 0.981691 2.49 0.993613 2.73 0.996833 3.18 0.999264 3.63 0.999858
0.14 0.555670 0.59 0.722405 1.04 0.850830 1.49 0.931888 1.65 0.950529 2.10 0.982136 2.50 0.993790 2.74 0.996928 3.19 0.999289 3.64 0.999864
0.15 0.559618 0.60 0.725747 1.05 0.853141 1.50 0.933193 1.66 0.951543 2.11 0.982571 2.51 0.993963 2.75 0.997020 3.20 0.999313 3.65 0.999869
0.16 0.563559 0.61 0.729069 1.06 0.855428 1.51 0.934478 1.67 0.952540 2.12 0.982997 2.52 0.994132 2.76 0.997110 3.21 0.999336 3.66 0.999874
0.17 0.567495 0.62 0.732371 1.07 0.857690 1.52 0.935745 1.68 0.953521 2.13 0.983414 2.53 0.994297 2.77 0.997197 3.22 0.999359 3.67 0.999879
0.18 0.571424 0.63 0.735653 1.08 0.859929 1.53 0.936992 1.69 0.954486 2.14 0.983823 2.54 0.994457 2.78 0.997282 3.23 0.999381 3.68 0.999883
0.19 0.575345 0.64 0.738914 1.09 0.862143 1.54 0.938220 1.70 0.955435 2.15 0.984222 2.55 0.994614 2.79 0.997365 3.24 0.999402 3.69 0.999888
0.20 0.579260 0.65 0.742154 1.10 0.864334 1.55 0.939429 1.71 0.956367 2.16 0.984614 2.56 0.994766 2.80 0.997445 3.25 0.999423 3.70 0.999892
0.21 0.583166 0.66 0.745373 1.11 0.866500 1.56 0.940620 1.72 0.957284 2.17 0.984997 2.57 0.994915 2.81 0.997523 3.26 0.999443 3.71 0.999896
0.22 0.587064 0.67 0.748571 1.12 0.868643 1.57 0.941792 1.73 0.958185 2.18 0.985371 2.58 0.995060 2.82 0.997599 3.27 0.999462 3.72 0.999900
0.23 0.590954 0.68 0.751748 1.13 0.870762 1.58 0.942947 1.74 0.959070 2.19 0.985738 2.59 0.995201 2.83 0.997673 3.28 0.999481 3.73 0.999904
0.24 0.594835 0.69 0.754903 1.14 0.872857 1.59 0.944083 1.75 0.959941 2.20 0.986097 2.60 0.995339 2.84 0.997744 3.29 0.999499 3.74 0.999908
0.25 0.598706 0.70 0.758036 1.15 0.874928 1.60 0.945201 1.76 0.960796 2.21 0.986447 2.61 0.995473 2.85 0.997814 3.30 0.999517 3.75 0.999912
0.26 0.602568 0.71 0.761148 1.16 0.876976 1.61 0.946301 1.77 0.961636 2.22 0.986791 2.62 0.995604 2.86 0.997882 3.31 0.999534 3.76 0.999915
0.27 0.606420 0.72 0.764237 1.17 0.879000 1.62 0.947384 1.78 0.962462 2.23 0.987126 2.63 0.995731 2.87 0.997948 3.32 0.999550 3.77 0.999918
0.28 0.610261 0.73 0.767305 1.18 0.881000 1.63 0.948449 1.79 0.963273 2.24 0.987455 2.64 0.995855 2.88 0.998012 3.33 0.999566 3.78 0.999922
0.29 0.614092 0.74 0.770350 1.19 0.882977 1.64 0.949497 1.80 0.964070 2.25 0.987776 2.65 0.995975 2.89 0.998074 3.34 0.999581 3.79 0.999925
0.30 0.617911 0.75 0.773373 1.20 0.884930 1.65 0.950529 1.81 0.964852 2.26 0.988089 2.66 0.996093 2.90 0.998134 3.35 0.999596 3.80 0.999928
0.31 0.621720 0.76 0.776373 1.21 0.886861 1.66 0.951543 1.82 0.965620 2.27 0.988396 2.67 0.996207 2.91 0.998193 3.36 0.999610 3.81 0.999931
0.32 0.625516 0.77 0.779350 1.22 0.888768 1.67 0.952540 1.83 0.966375 2.28 0.988696 2.68 0.996319 2.92 0.998250 3.37 0.999624 3.82 0.999933
0.33 0.629300 0.78 0.782305 1.23 0.890651 1.68 0.953521 1.84 0.967116 2.29 0.988989 2.69 0.996427 2.93 0.998305 3.38 0.999638
0.34 0.633072 0.79 0.785236 1.24 0.892512 1.69 0.954486 1.85 0.967843 2.30 0.989276 2.70 0.996533 2.94 0.998359 3.39 0.999651
0.35 0.636831 0.80 0.788145 1.25 0.894350 1.70 0.955435 1.86 0.968557 2.31 0.989556 2.50 0.993790 2.95 0.998411 3.40 0.999663
0.36 0.640576 0.81 0.791030 1.26 0.896165 1.42 0.922196 1.87 0.969258 2.32 0.989830 2.51 0.993963 2.96 0.998462 3.41 0.999675
0.37 0.644309 0.82 0.793892 1.27 0.897958 1.43 0.923641 1.88 0.969946 2.33 0.990097 2.52 0.994132 2.97 0.998511 3.42 0.999687
0.38 0.648027 0.83 0.796731 1.28 0.899727 1.44 0.925066 1.89 0.970621 2.34 0.990358 2.53 0.994297 2.98 0.998559 3.43 0.999698
0.39 0.651732 0.84 0.799546 1.29 0.901475 1.45 0.926471 1.90 0.971283 2.35 0.990613 2.54 0.994457 2.99 0.998605 3.44 0.999709
0.40 0.655422 0.85 0.802337 1.30 0.903200 1.46 0.927855 1.91 0.971933 2.36 0.990863 2.55 0.994614 3.00 0.998650 3.45 0.999720
0.41 0.659097 0.86 0.805105 1.31 0.904902 1.47 0.929219 1.92 0.972571 2.37 0.991106 2.56 0.994766 3.01 0.998694 3.46 0.999730
0.42 0.662757 0.87 0.807850 1.32 0.906582 1.48 0.930563 1.93 0.973197 2.38 0.991344 2.57 0.994915 3.02 0.998736 3.47 0.999740
0.43 0.666402 0.88 0.810570 1.33 0.908241 1.49 0.931888 1.94 0.973810 2.39 0.991576 2.58 0.995060 3.03 0.998777 3.48 0.999749
0.44 0.670031 0.89 0.813267 1.34 0.909877 1.50 0.933193 1.95 0.974412 2.40 0.991802 2.59 0.995201 3.04 0.998817 3.49 0.999758
84
Tabela estatstica B - Distribuio t de Student P(T>t)=
Tabela estatstica A- t -Student

) ( t T P

Graus de
Liberdade

0,25 0,10 0,05 0,025 0,010 0,005
1 1,000 3,078 6,314 12,706 31,821 63,656
2 0,816 1,886 2,920 4,303 6,965 9,925
3 0,765 1,638 2,353 3,182 4,541 5,841
4 0,741 1,533 2,132 2,776 3,747 4,604
5 0,727 1,476 2,015 2,571 3,365 4,032
6 0,718 1,440 1,943 2,447 3,143 3,707
7 0,711 1,415 1,895 2,365 2,998 3,499
8 0,706 1,397 1,860 2,306 2,896 3,355
9 0,703 1,383 1,833 2,262 2,821 3,250
10 0,700 1,372 1,812 2,228 2,764 3,169
11 0,697 1,363 1,796 2,201 2,718 3,106
12 0,695 1,356 1,782 2,179 2,681 3,055
13 0,694 1,350 1,771 2,160 2,650 3,012
14 0,692 1,345 1,761 2,145 2,624 2,977
15 0,691 1,341 1,753 2,131 2,602 2,947
16 0,690 1,337 1,746 2,120 2,583 2,921
17 0,689 1,333 1,740 2,110 2,567 2,898
18 0,688 1,330 1,734 2,101 2,552 2,878
19 0,688 1,328 1,729 2,093 2,539 2,861
20 0,687 1,325 1,725 2,086 2,528 2,845
21 0,686 1,323 1,721 2,080 2,518 2,831
22 0,686 1,321 1,717 2,074 2,508 2,819
23 0,685 1,319 1,714 2,069 2,500 2,807
24 0,685 1,318 1,711 2,064 2,492 2,797
25 0,684 1,316 1,708 2,060 2,485 2,787
26 0,684 1,315 1,706 2,056 2,479 2,779
27 0,684 1,314 1,703 2,052 2,473 2,771
28 0,683 1,313 1,701 2,048 2,467 2,763
29 0,683 1,311 1,699 2,045 2,462 2,756
30 0,683 1,310 1,697 2,042 2,457 2,750
31 0,682 1,309 1,696 2,040 2,453 2,744
32 0,682 1,309 1,694 2,037 2,449 2,738
33 0,682 1,308 1,692 2,035 2,445 2,733
34 0,682 1,307 1,691 2,032 2,441 2,728
35 0,682 1,306 1,690 2,030 2,438 2,724
36 0,681 1,306 1,688 2,028 2,434 2,719
37 0,681 1,305 1,687 2,026 2,431 2,715
38 0,681 1,304 1,686 2,024 2,429 2,712
39 0,681 1,304 1,685 2,023 2,426 2,708
40 0,681 1,303 1,684 2,021 2,423 2,704
45 0,680 1,301 1,679 2,014 2,412 2,690
46 0,680 1,300 1,679 2,013 2,410 2,687
47 0,680 1,300 1,678 2,012 2,408 2,685
48 0,680 1,299 1,677 2,011 2,407 2,682
49 0,680 1,299 1,677 2,010 2,405 2,680
50 0,679 1,299 1,676 2,009 2,403 2,678
80 0,678 1,292 1,664 1,990 2,374 2,639
90 0,677 1,291 1,662 1,987 2,368 2,632
100 0,677 1,290 1,660 1,984 2,364 2,626
120 0,677 1,289 1,658 1,980 2,358 2,617

0,674 1,282 1,645 1,960 2,326 2,576

84 85
Tabela estatstica C - Distribuio F - P(F > f; n,d) = 0.05
Grau de
Liberdade do
Denominador
Grau de Liberdade do Numerador Grau de
Liberdade do
Denominador
Grau de Liberdade do Numerador
1 2 3 4 1 2 3 4
1 161.45 199.5 215.71 224.58 27 4.21 3.35 3.35 2.73
2 18.51 19.00 19.16 19.25 28 4.2 3.34 3.34 2.71
3 10.13 9.55 9.28 9.12 29 4.18 3.33 3.33 2.70
4 7.71 6.94 6.59 6.39 30 4.17 3.32 3.32 2.69
5 6.61 5.79 5.41 5.19 31 4.16 3.3 3.3 2.68
6 5.99 5.14 4.76 4.53 32 4.15 3.29 3.29 2.67
7 5.59 4.74 4.35 4.12 33 4.14 3.28 3.28 2.66
8 5.32 4.46 4.07 3.84 34 4.13 3.28 3.28 2.65
9 5.12 4.26 3.86 3.63 35 4.12 3.27 3.27 2.64
10 4.96 4.1 3.71 3.48 36 4.11 3.26 3.26 2.63
11 4.84 3.98 3.59 3.36 37 4.11 3.25 3.25 2.63
12 4.75 3.89 3.49 3.26 38 4.1 3.24 3.24 2.62
13 4.67 3.81 3.41 3.18 39 4.09 3.24 3.24 2.61
14 4.6 3.74 3.34 3.11 40 4.08 3.23 3.23 2.61
15 4.54 3.68 3.29 3.06 41 4.08 3.23 3.23 2.60
16 4.49 3.63 3.24 3.01 42 4.07 3.22 3.22 2.59
17 4.45 3.59 3.2 2.96 43 4.07 3.21 3.21 2.59
18 4.41 3.55 3.16 2.93 44 4.06 3.21 3.21 2.58
19 4.38 3.52 3.13 2.9 45 4.06 3.2 3.2 2.58
20 4.35 3.49 3.1 2.87 46 4.05 3.2 3.2 2.57
21 4.32 3.47 3.07 2.84 47 4.05 3.2 3.2 2.57
22 4.3 3.44 3.05 2.82 48 4.04 3.19 3.19 2.57
23 4.28 3.42 3.03 2.8 49 4.04 3.19 3.19 2.56
24 4.26 3.4 3.01 2.78 50 4.03 3.18 3.18 2.56
25 4.24 3.39 2.99 2.76 120 3.92 3.07 3.07 2.45
26 4.23 3.37 2.98 2.74 3.84 3 3 2.37

You might also like