You are on page 1of 65

Aula 08

Estatstica p/ AFRFB 2014 (com videoaulas)


Professor: Jeronymo Marcondes
Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

AULA 08 Correlao e Regresso

SUMRIO PGINA
Associao entre variveis 2
Associao entre variveis qualitativas 4
Associao entre variveis quantitativas 10
Associao entre variveis qualitativas e quantitativas 15
Introduo ao mtodo de regresso 17
Estimao com base em amostra e Mtodo dos Mnimos 21
Quadrados Ordinrios (MQO)
Tabela ANOVA 28
Teste de hipteses sobre os coeficientes 35
Eficincia do estimador de Mnimos Quadrados Ordinrios (MQO) 38
Lista de Exerccios resolvidos 56
Gabarito 64

Bem vindos nossa ltima aula terica! Nesta aula, temos alguns assuntos
importantes para discutir:

1) Correlao.
2) Regresso Linear.

Dica de um concurseiro

Aquele pensamento de estudar matrias de exatas, tais


como estatstica, s por exerccios no muito correto. Toda
matria, independentemente de qual, deve ser estudada com
base em teoria tambm. Muitos exerccios podem exigir
conhecimentos mais aprofundados, tal como vocs vero no
simulado.

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 1 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

1. Associao entre variveis

At agora estudamos o comportamento de variveis com distribuies e parmetros


definidores de sua dinmica, tal como sua mdia, por exemplo.

Mas, uma questo que os estatsticos sempre tm que abordar : como o


comportamento conjunto de mais de uma varivel?

Por exemplo, um pesquisador pode estar interessado em saber como a renda dos
indivduos de uma determinada regio est correlacionada com seus gastos em
consumo. O que deve ser feito avaliar como a varivel renda de um determinado
indivduo se relaciona com a varivel gastos em consumo do mesmo.

Neste caso, teramos um conjunto de variveis relativas renda dos diversos


indivduos pesquisados ( ) e outro conjunto com as variveis relativas ao consumo
destes mesmos indivduos ( ). Suponha que nossa amostra seja dada por 8 (oito)
indivduos, cujos valores para estas variveis sejam dados por:

Renda Consumo
Indivduo (R$) (R$)
1 1000 700
2 1500 800
3 2000 1000
4 2300 1100
5 2700 1200
6 5500 2300
7 6000 2500
8 7300 3000

Se voc colocar em um grfico os pontos relativos a cada indivduo, de forma que


localizemos o valor de consumo no eixo vertical, da renda no eixo horizontal e que o
ponto seja a interseco destes valores, teramos o seguinte grfico de disperso:

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 2 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

Olhe o que este grfico est te mostrando! Conforme a renda cresce, o valor gasto
em consumo tambm cresce, mas a taxas decrescentes. Veja que, para o primeiro
indivduo o consumo 70% de toda sua renda, enquanto que, para o 8 indivduo, o
consumo 41%.

Viu que concluso interessante voc tirou a partir da anlise desta amostra fictcia?
A lista de possibilidades infinita! Vocs tero que fazer isso vrias vezes na
Receita, pois a anlise de muitos projetos necessita este conhecimento estatstico.

Assim, nesta aula, precisaremos estudar a forma de avaliar o comportamento


conjunto de variveis. Entretanto, vocs devem lembrar-se de que h dois tipos de
variveis: quantitativas e qualitativas. Assim, podemos ter 3 (trs) casos de
associao entre variveis:

1) Entre duas variveis qualitativas;


2) Entre duas variveis quantitativas;
3) Entre uma varivel qualitativa e outra quantitativa.

Ento, vamos comear!

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 3 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

2. Associao entre variveis qualitativas

Para que vocs entendam direitinho, vamos analisar alguns exemplos do livro
Estatstica Bsica dos professores Bussab e Morettin.

Suponha que queiramos verificar se existe associao entre o sexo e a carreira


escolhida por 200 alunos de Economia e Administrao. Ns podemos verificar
como se d a distribuio conjunta destas variveis por meio de uma tabela de
dupla entrada ou tabela de contingncia. Veja como seria uma tabela deste tipo:

Curso\Sexo Masculino Feminino Total


Economia 85 35 120
Administrao 55 25 80
Total 140 60 200

Olhe, cada entrada da tabela representa quantas vezes ocorre cada realizao
conjunta. No entendeu? Veja o primeiro quadradinho da tabela, que tem o valor
de 85:

Curso\Sexo Masculino Feminino Total


Economia 85 35 120
Administrao 55 25 80
Total 140 60 200

O que ele est te dizendo que h 85 homens que cursam economia, ou seja, ele
d a realizao simultnea de ( )e( ).

Em termos matriciais, ns podemos chamar esta


clula de ( ), pois se trata da interseco da primeira linha com a primeira coluna.
Assim, sempre que voc ver a definio de uma clula de uma matriz com base em
dois nmeros entre parnteses ( e , por exemplo), o que isso est te falando
que: .

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 4 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

Este um exemplo de amostragem aleatria estratificada em contraposio


amostragem aleatria simples, que estudamos at agora! Esta ltima o caso no
qual qualquer membro da populao tem a mesma chance de ser sorteado para a
amostra, como se fosse um sorteio. J no presente exemplo, a populao foi
dividida em subgrupos (tal como homens e mulheres, por exemplo) e, a partir da,
realizada uma amostragem aleatria simples em cada um destes estratos.

E qual a quantidade de alunos de Economia, independentemente do sexo?

Ora, basta somar a linha respectiva economia:

Curso\Sexo Masculino Feminino Total


Economia 85 35 120
Administrao 55 25 80
Total 140 60 200

Entendeu? H 120 alunos de Economia, sendo 85 homens e 35 mulheres. Este


valor, que nos d o valor total de realizaes de uma varivel qualitativa
(independentemente das outras variveis qualitativas), chamado de distribuio
marginal. Na nossa tabela, estes valores esto nas clulas (1,3), (2,3), (3,1) e (3,2).

Em vez de trabalharmos com frequncias absolutas, como o caso, fica mais fcil
visualizar interaes utilizando frequncias relativas!

-Como fazer isso, professor?

Basta dividir as clulas pelas suas distribuies marginais.

Mas, devo utilizar as distribuies marginais das linhas ou das colunas?

A,depende do que voc quer avaliar. No nosso caso, vamos fixar o total dos sexos
como 100% e, com base nisso, encontrar quanto cada curso representa de
matriculas por sexo. Veja como ficaria:

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 5 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

Curso\Sexo Masculino Feminino Total


Economia 61% 58% 60%
Administrao 39% 42% 40%
Total 100% 100% 100%

Viu o que eu fiz? Eu dividi cada clula pelo total dado pela coluna e multipliquei por
100. Por exemplo, na clula (1,1), realizamos a diviso de 85 por 140, o que d,
aproximadamente, 0,61.

Agora eu te pergunto: existe relao entre o sexo da pessoa e o curso escolhido?

Quando ns fixamos a coluna e encontramos as frequncias relativas, estamos


encontrando, nas duas primeiras colunas, qual o percentual de cada sexo que
frequenta cada curso, enquanto que, na ltima coluna, determinamos o percentual
de pessoas que frequenta cada curso, independentemente do sexo.

Isso no te lembra nada? Exatamente! As


probabilidades condicionais. As duas primeiras colunas referem-se a frequncias
condicionais, enquanto que a ltima seria como se fosse uma frequncia
incondicional. Lembra-se de que, quando os eventos so independentes, a
probabilidade condicional igual incondicional? Aplique um raciocnio anlogo ao
presente caso, se a frequncia condicional muito prxima incondicional, a
condio parece no ajudar a explicar o fenmeno.

Vamos exemplificar! No nosso exemplo, 60% das pessoas da populao


frequentam cursos de Economia e 40% frequentam cursos de Administrao,
independentemente do sexo. Assim, olhando a tabela, podemos ver que as
propores do sexo masculino (61% e 39%) e feminino (58% e 42%) so muito
prximas das marginais (60% e 40%). Este resultado parece indicar no haver
dependncia entre as duas variveis. Com base nestas afirmaes podemos inferir
que, provavelmente, o sexo de uma pessoa no influencia na escolha entre
cursos de Economia e Administrao.

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 6 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

Veja outro exemplo:

Curso\Sexo Masculino Feminino Total


Fsica 100 (71%) 20(33%) 120(60%)
Cincias Sociais 40 (29%) 40(67%) 80(40%)
Total 140(100%) 60(100%) 200(100%)

Agora a coisa diferente! Veja que as propores de frequncia nos cursos de


Fsica e Cincias Sociais por parte do sexo masculino (71% e 29%,
respectivamente) e feminino (29% e 67%, respectivamente) so muito diferentes
das propores marginais (60% e 40%, respectivamente). Ou seja, quando
inclumos a informao referente ao sexo do indivduo, a distribuio de pessoas
pelos cursos se modifica muito com relao ao total geral. Assim, as variveis
parecem estar associadas!

Porm, muitas vezes, importante quantificar esta associao, isso , o


quanto estas variveis esto associadas?

Para isso utilizaremos o chamado coeficiente de contingncia de Pearson. Este


coeficiente se baseia no somatrio dos desvios de cada clula com relao ao seu
valor esperado caso as variveis em estudo no fossem associadas. No entendeu
nada, no ? Vamos voltar ao exemplo dos alunos de Fsica e Cincias Sociais.

No fundo, o que fizemos foi comparar a proporo marginal de cada curso com
relao s suas respectivas propores associada a cada sexo. Assim, caso as
variveis no tivessem nenhuma associao, esperar-se-ia que:

Curso\Sexo Masculino Feminino Total


Fsica 84 (60%) 36 (60%) 120 (60%)
Cincias Sociais 56 (40%) 24 (40%) 80 (40%)
Total 140 (100%) 60(100%) 200 (100%)

Entendeu? Se as variveis no forem associadas, espera-se que 60% das pessoas


frequentaro cursos de Fsica e 40% cursos de Cincias Sociais,
independentemente do sexo. Se isso for verdade, basta aplicar estes

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 7 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08
percentuais no total de cada coluna que encontraramos os valores esperados
de cada clula se as variveis no fossem associadas.

Se compararmos o valor real de cada clula com seu valor esperado, teremos a
seguinte distribuio:

Curso\Sexo Masculino Feminino Total


Fsica 100-84 16 20-36 -16 0
Cincias Sociais 40- 56 -16 40-24 16 0
Total 0 0 0

Este o mesmo problema que encontramos quando estudamos a varincia,


pois a soma dos desvios deve igualar zero. Assim, vamos adotar uma estratgia
semelhante para resolver o problema, elevando os desvios ao quadrado e dividindo
tal resultado pelo valor esperado da clula:

Curso\Sexo Masculino Feminino


Fsica (16)/84 (-16)/36
Cincias Sociais (-16)/56 (16)/24

Pode-se provar que a soma de todos estes elementos


gera uma estatstica de teste qui-quadrado ( ). No cabe demonstrar isso
aqui, portanto, decore!

Assim, a estatstica de teste para anlise de associao entre estas variveis


dada por:

Este um valor significantemente maior do que zero, portanto, pode-se inferir que
as variveis esto associadas. Quanto maior este valor, menor a associao
entre as variveis.

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 8 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

Viu como se faz? Portanto, guarde a frmula:

Sendo que esta expresso est te dizendo para somar, para todas as clulas ( ), o
quadrado das diferenas entre o valor real ( ) e o valor esperado em cada clula
( ), caso as variveis no fossem associadas, divido pelo seu respectivo valor
esperado.

T bom professor, mas devo comparar este valor com a tabela qui-
quadrado?

Olha, no precisamos entrar nisso. Esta parte fica um pouco mais complicadinha e
nunca cai em concursos que no sejam especficos para estatsticos. Assim, s
saiba calcular a estatstica de teste e o coeficiente de Pearson que j basta.

Com base neste valor qui-quadrado, pode-se calcular o coeficiente de contingncia


de Pearson, dado por:

Sendo o tamanho da amostra.

Surge uma pergunta natural:

-Qual o tamanho ideal de minha amostra?

Essa uma pergunta sem uma nica resposta! Isso muda de autor para autor. Mas,
importante que vocs conheam uma regrinha de bolso para determinao do
valor ideal de uma amostra com base no erro amostral tolervel ( ).

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 9 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

Ns j estudamos o que um erro amostral: a margem


de erro da aula anterior. Existe uma frmula que nos d a amostra mnima com
base no mximo de erro que estamos dispostos a cometer:

Isso , para um erro amostral da ordem de 4%, devemos ter uma amostra de, no
mnimo:

Ou seja, nossa amostra deve ter, no mnimo, 625 elementos.

3. Associao entre variveis quantitativas

No caso de uma anlise entre variveis quantitativas o nosso arsenal para anlise
muito maior! Ns podemos tanto utilizar o que estudamos na seo anterior,
quanto outras possibilidades grficas, como o diagrama de disperso.

Veja o exemplo que demos no incio da aula:


Renda Consumo
Indivduo (R$) (R$)
1 1000 700
2 1500 800
3 2000 1000
4 2300 1100
5 2700 1200
6 5500 2300
7 6000 2500
8 7300 3000

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 10 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

Este um caso de variveis quantitativas em que podemos usar o diagrama de


disperso, ensinado na aula 00. O que eu quero que vocs notem o seguinte:

Consumo x Renda
3500
3000
2500
Consumo

2000
1500
1000
500
0
0 2000 4000 6000 8000
Renda

Entendeu? Se voc traar uma reta que mais ou menos que une os pontos, voc
encontra uma reta inclinada para cima, ou como chamam os matemticos,
positivamente inclinada. O que isso quer dizer : quanto maior a renda, maior
ser o consumo associado, isso , trata-se de variveis positivamente
correlacionadas.

Este um caso possvel de associao entre duas variveis quantitativas, mas no


o nico. As variveis podem ser negativamente correlacionadas. Neste caso,
quanto maior uma delas, menor ser o valor associado na outra.

Quer um exemplo? Suponha que seja feita uma pesquisa que relacione o PIB de 6
economias com a taxa de incidncia de leptospirose nas mesmas. de se esperar
que economias mais ricas tendam a ter melhores condies de saneamento, o que
reduz a taxa de incidncia desta doena. Em termos grficos, seria algo mais ou
menos assim:

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 11 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

Com efeito, os pontos indicam que, quanto maior o PIB, menor a taxa de incidncia
da doena. O traado de uma reta que explicita esta dinmica mostra uma reta
inclinada para baixo, ou negativamente inclinada. Este um caso de variveis
negativamente associadas.

Os dois casos mostram exemplos de correlao linear, ou seja, que podem ser
representados por uma linha reta. Podem existir casos de associao no linear,
entretanto no vamos entrar neste detalhe. Apenas entenda o que uma
associao entre variveis, que pode ser positiva (quando uma aumenta a
outra tambm aumenta, ou quando uma se reduz a outra tambm reduz) ou
negativa (quando uma aumenta a outra reduz ou quando uma reduz a outra
aumenta). No frigir dos ovos: uma relao positiva significa que a direo
em que uma varivel se movimenta a mesma da outra varivel, por outro
lado, uma relao negativa implica que as variveis se movimentaro em
sentidos opostos.

-E se as variveis forem no associadas?

Boa pergunta! Neste caso, no conseguiremos tirar uma tendncia da anlise


grfica. A ttulo de ilustrao:

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 12 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

Neste caso, no h uma tendncia clara entre as duas variveis! Este um exemplo
de variveis no associadas.

Uma medida numrica de associao pode ser obtida pelo coeficiente de


correlao ( ). Para uma amostra de tamanho ( ), o coeficiente de correlao entre
duas variveis quaisquer, e , dado por:

Sendo e as mdias e e os desvios padres das variveis e


respectivamente.

Em termos bem simples, cada parntese representa a verso padronizada de cada


uma das variveis, portanto o coeficiente de correlao igual mdia dos
produtos dos valores padronizados das variveis em anlise. Este valor vai de 1
(menos hum) a 1 (hum):

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 13 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

Um valor prximo de 1 indica associao positiva, enquanto


que outro prximo de -1 indica associao negativa. Um valor prximo de zero
indica no associao entre variveis.

Outra forma de explicitar o coeficiente de correlao por meio da covarincia.

Covarincia ( ) uma medida da varincia conjunta entre duas variveis. Para


uma amostra de tamanho ( ), a covarincia entre duas variveis quaisquer, e ,
dada por:

A fica fcil ver que:

Entendeu? Antes de passarmos para o prximo tpico, vocs precisam saber uma
coisa importante demais sobre a covarincia!

A covarincia entre duas variveis influenciada pela


associao que uma varivel tem sobre a outra. Assim, se duas variveis so
independentes, a covarincia entre ambas igual zero. Porm, o fato de a
covarincia entre duas variveis ser igual zero no quer dizer que elas sejam
independentes. Ateno a isso!

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 14 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

4. Associao entre variveis quantitativas e qualitativas

Este um caso que no muito cobrado em concurso, assim vamos tentar ser mais
rpidos aqui.

Vamos nos basear em outro exemplo dos professores Bussab e Morettin. Suponha
que seja feita uma pesquisa de forma a avaliar o comportamento dos salrios
(varivel quantitativa) dentro de cada categoria de grau de instruo (varivel
qualitativa). Os resultados encontrados foram:

Grau de Instruo Tamanho da amostra ( ) Mdia Salarial Varincia Amostral


Fundamental 12 7,84 7,77
Mdio 18 11,54 13,1
Superior 6 16,48 16,89
Total 36 11,12 20,46

Pode-se inferir que, quanto maior o nvel educacional, na mdia, maior ser o
salrio do indivduo. Uma forma de confirmar a veracidade dessa afirmao
percebendo que a varincia amostral para todos os dados maior do que a
varincia para cada subclasse.

-Por que isso importante?

Ora, se os dados totais apresentam maior varincia do que cada classe


individualmente, isso significa que reduzir nossa anlise a subclasse melhora a
acurcia de nossas concluses.

-E se, por exemplo, a varincia da subclasse ensino superior fosse de 23?

Neste caso, a subdiviso dos dados em uma classe de nvel superior no estaria
ajudando na anlise, pois a variabilidade seria menor se analisssemos os dados
dos salrios como um todo.

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 15 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

Assim, podemos quantificar o grau de associao entre duas variveis como o


ganho relativo na varincia obtido pela introduo da varivel qualitativa.
Isso feito por meio do R (ns a estudaremos com mais detalhes logo mais).

Para quantificarmos o R precisamos definir ( ), a mdia das varincias dentro


dos subgrupos, que chamaremos de varincia mdia. Ao definirmos como
o produto da varincia do subgrupo pelo tamanho da amostra no mesmo, a
varincia mdia ser dada por:

Assim, com base na varincia total da amostra ( ), podemos definir R como:

Ento se aplicarmos esta frmula a nosso exemplo acima:

Isso quer dizer que 41,5% da variabilidade dos salrios explicada pela
varivel grau de instruo.

Beleza, terminamos a parte de correlao, vamos regresso!

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 16 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

5. Introduo ao mtodo de Regresso

Pessoal, hora de forar a memria escolar e lembrar o que uma funo, ou


melhor, uma funo linear. Funo uma relao entre duas variveis, como por
exemplo:

a) Vendas de uma empresa e gastos em propaganda;

b) Aumento de peso de uma pessoa e quantidade de comida ingerida;

c) Valor da conta de energia e nmero de equipamentos eltricos em uma casa.

Se chamarmos a primeira varivel de cada item de y e a segunda de x,


matematicamente, pode-se descrever tal relao como:

y = f(x).

O que quer dizer y funo de x, ou que as vendas de uma empresa so uma


funo da quantidade investida em propaganda. Pode-se afirmar que y depende de
x, portanto, a nomenclatura usual chama y de varivel dependente ou explicada e x
de varivel independente ou explicativa.

Uma das formas de se expressar tal funo a partir de uma relao linear, tal
como:

y = 2 + 3x.

Ou, genericamente, para qualquer valor que pudesse substituir 2 e 3 na equao


acima:

y= + x. (1)

Este um exemplo de uma funo linear, dado que o expoente de x 1. (lembrem-


se que qualquer varivel elevada a 1 igual prpria varivel). Esta funo linear
(lembrem-se da escola) uma reta. Se x estivesse elevado ao quadrado, seria uma
parbola. Para que voc tenha certeza que isso uma reta, substitua alguns valores

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 17 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08
na primeira equao e os coloque em um grfico, voc ver que se trata de uma
equao de reta.

- Professor, timo, mas por que voc est falando tudo isso?

Porque, meus queridos alunos, um dos principais objetivos da anlise de regresso


encontrar uma funo linear que descreva o comportamento estatstico entre duas
variveis. Assim, com base em uma srie estatstica, a estimao de uma regresso
possibilitaria que voc encontrasse os valores de e na equao (1).

O processo de encontrar a relao entre y e x chamado de Regresso e,


se for uma reta, como na equao (1), chamado de Regresso Linear.
Como a equao (1) s possui uma varivel explicativa, o processo de
encontrar tal relao se chama Regresso Linear Simples.

Porm, perceba que muito raro que uma varivel do mundo real, ainda mais
quando ligada economia ou a fenmenos sociais, consiga ser representada por
uma reta. Vamos supor que estamos tratando do exemplo (a) acima descrito para o
ano de 2012 e que possumos dados de todas as vendas de todas as empresas de
um determinado setor e de todos os gastos de propaganda efetuados por estas
empresas.1 Colocando tal relao em um grfico:

1
Gente, s para chamar a ateno, por enquanto estamos trabalhando com dados coletados em um
nico perodo de tempo, no caso uma nica observao por empresa no ano de 2012 (pode ser a soma
de todo o ano, ou de um determinado ms, etc.) Este tipo de disposio de dados chamado de dados em
cortes transversais ou cross section.

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 18 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

A reta representada pela equao (1) e os pontos so os valores que y assume


para cada x.

E a pessoal, o que vocs esto vendo? Veja que a reta explica bem o
comportamento da varivel, se aproximando dos valores reais, mas ainda assim no
explica tudo. Olhe o 3 ponto, nele o valor das vendas aumentou, na mdia, muito
mais do que o esperado para um determinado investimento em propaganda. Isso
pode ser decorrncia de muitos fatores do mundo real, como o fato de que a
empresa talvez fosse muito desconhecida at ento, portanto, um pequeno
investimento em propaganda teve resultados muito grandes quando comparado a
empresas que j so relativamente conhecidas. Este tipo de raciocnio pode ser
aplicado para os pontos abaixo da reta tambm, que apresentam, na mdia,
retornos abaixo do esperado para um determinado gasto em propaganda.

Assim, se uma verso linear e simples da equao de reta for a mais bem ajustada
srie de dados, pode-se inferir que a equao que representa a real dinmica do
fenmeno em estudo, no caso, as vendas da empresa dada por:

Sendo o termo que representa o erro, ou seja, os desvios das observaes com
relao reta (pensem comigo, o erro a distncia da reta at cada um daqueles
pontos no grfico acima). O subscrito i se refere cada uma das empresas

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 19 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08
analisadas em 2012, isto , a empresa representada no primeiro ponto no grfico
tem subscrito (1), a segunda subscrito (2) e assim por diante.

Vocs concordam comigo que no d para levar em conta todas as variveis que
afetam o comportamento das vendas de todas as empresas? Pode ser que um
gerente comercial muito bom de servio tenha pedido demisso da empresa (4), o
que puxaria suas vendas para baixo, apesar do investimento em propaganda, etc.
Assim, o erro leva em conta estes efeitos impossveis de se mensurar, mas que
afetam a dinmica de y.

Bom, apesar do fato de que este erro algo que ns temos que aprender a viver
com ele, o mesmo possui uma caracterstica interessante que ns temos que levar
em conta:

Isto , a mdia dos erros igual a zero. Ou seja, os desvios para cima da reta
igualam o valor dos desvios para baixo da reta na mdia.

1 hiptese sobre o modelo de regresso linear:

Ou seja, estes erros so supostamente aleatrios, ento a teoria nos permite inferir
que, se o modelo estiver corretamente especificado, o erro ser, na mdia, igual
zero.

E a rapaziada, que cara de sono esta? Vamos acordando, pois um futuro auditor
da Receita no pode dormir em servio! Voc ser bem remunerado e com status,
mas com muita responsabilidade.

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 20 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

6. Estimao com base em amostra e Mtodo dos Mnimos Quadrados


Ordinrios (MQO)

Vamos ver se vocs esto realmente atentos: lembram-se quando eu disse que a
regresso tinha a ver com todas as empresas, todas as receitas de vendas e todos
os gastos em propaganda?

Ateno, at agora falamos de uma regresso com a populao, ou universo, das


variveis escolhidas. Mas, na maioria dos casos, no possumos o universo. Por
exemplo, no caso de uma regresso do valor salarial obtido por um trabalhador em
funo do nvel de escolaridade de cada um destes, praticamente impossvel se
realizar este exerccio, pois a base de dados para isto infinitamente grande.
Assim, na maior parte das vezes, o pesquisador acaba trabalhando com uma
amostra! Ao se avaliar uma regresso para uma amostra estaremos a estimar os
parmetros de regresso ( e na equao (1)), ou como ns falamos no dia a
dia, estimar uma regresso.

- T bom Professor, mas, afinal de contas, como se estima uma regresso?

timo! Tente imaginar um momento: a estimativa dos parmetros deve ser feita de
forma a garantir o que?

isso! De forma a minimizar os erros. Isso feito pelo mtodo dos Mnimos
Quadrados Ordinrios (MQO) que nos d um valor estimado para e , que,
chamaremos, a partir daqui, de e .

Com base no fato de que a mdia dos erros igual a zero, no h como se
minimizar a soma dos erros, dado que o valor sempre ser zero. Assim, o objetivo
do mtodo minimizar a soma dos quadrados dos erros, o que feito pelo

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 21 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08
estimador de MQO. Gente, sejamos prticos, nunca caiu e, provavelmente, nunca
vai cair a derivao do estimador de MQO, assim, decorem:

Sendo que o travesso sobre determinada varivel representa o valor mdio da


mesma, define-se a mdia de uma varivel, bem como o valor de uma varivel
centrada na mdia:

Assim, b pode ser encontrado pelo somatrio da multiplicao de cada


com seu respectivo (covarincia entre x e y) dividido pela soma de todos os
elevados ao quadrado (varincia de x). Gente, muita ateno mesmo, perceba que
as variveis devem ser inseridas na frmula acima de forma a estarem centradas na
mdia, ou seja, reduzidas do valor da mdia de sua srie.

Ateno! Muitos exerccios de concursos pblicos se utilizam de propriedades


estatsticas que permitem inferir que:

Ou seja, o exerccio fornece o somatrio das variveis utilizadas na equao,


mas sem estarem centradas na mdia. Neste caso, voc precisa decorar estas
frmulas, ok?

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 22 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

No caso da segunda equao, que define (tambm chamado de intercepto), h


uma forma especfica, mas ela um pouco esquisita e eu acho que esta forma
facilita a memorizao, dado que com os valores mdios das variveis e com a
estimativa de b, encontra-se .

Exerccio 1

S para vocs ficarem contentes em ver uma aplicao prtica, vamos fazer
um exemplo. Vamos l! Dada a seguinte srie de dados, estime a regresso
linear Y = f(X), ou costumeiramente chamada de Y contra X.

Variveis X Y
103 160
123 167
145 207
126 173
189 256
211 290
178 237
155 209
141 193
156 219
166 235
179 234
197 273
204 272
125 181
112 166
107 161
135 195
144 201
188 255
Soma 3084 4284
Mdia 154,2 214,2

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 23 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

Resoluo

Bom, primeiramente, vamos encontrar alguns dados necessrios para a

X Y
Variveis X Y X(centrado)*Y(centrado) (X centrado) (Y centrado)
centrado centrado
103 160 -51,2 -54,2 2775,04 2621,44 2937,64
123 167 -31,2 -47,2 1472,64 973,44 2227,84
145 207 -9,2 -7,2 66,24 84,64 51,84
126 173 -28,2 -41,2 1161,84 795,24 1697,44
189 256 34,8 41,8 1454,64 1211,04 1747,24
211 290 56,8 75,8 4305,44 3226,24 5745,64
178 237 23,8 22,8 542,64 566,44 519,84
155 209 0,8 -5,2 -4,16 0,64 27,04
141 193 -13,2 -21,2 279,84 174,24 449,44
156 219 1,8 4,8 8,64 3,24 23,04
166 235 11,8 20,8 245,44 139,24 432,64
179 234 24,8 19,8 491,04 615,04 392,04
197 273 42,8 58,8 2516,64 1831,84 3457,44
204 272 49,8 57,8 2878,44 2480,04 3340,84
125 181 -29,2 -33,2 969,44 852,64 1102,24
112 166 -42,2 -48,2 2034,04 1780,84 2323,24
107 161 -47,2 -53,2 2511,04 2227,84 2830,24
135 195 -19,2 -19,2 368,64 368,64 368,64
144 201 -10,2 -13,2 134,64 104,04 174,24
188 255 33,8 40,8 1379,04 1142,44 1664,64
Soma 3084 4284 21199,2 31513,2
Mdia 154,2 214,2 1059,96 1575,66
resoluo.

Vamos aplicar a frmula:

Com base no resultado acima, podemos calcular:

Portanto, a reta estimada por meio de MQO :

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 24 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

Voltando aula!

Pessoal, vocs esto entendendo o que representa cada coeficiente? Pense um


pouquinho, se o valor gasto em propaganda aumenta em 1 (uma unidade),
espera-se que o valor das vendas varie, na mdia, em b.

Cabe destacar a diferena entre erros e resduos. Os erros so decorrentes dos


aspectos que relatamos acima, j os resduos so os erros de ajuste aps a
estimao da reta original (1), ou seja, na regresso feita com base na amostra e
no mais na populao. Assim, a verso estimada de (1) dada por:

(2)

Ento, estes parmetros so a verso estimada dos parmetros na equao (1).


Portanto, so os resduos da regresso com base em uma amostra n da
populao N.

Meus amigos, vocs conseguem enxergar que este resduo tem mais um problema
alm dos j citados para os erros? Lembra do gerente comercial eficiente que pediu
demisso? Ento, este um desvio natural de se interpretar um comportamento
econmico, derivado de influncias de infinitas variveis, a partir de uma reta.
Agora, h outro fator em cena, h um erro decorrente de se inferir uma estimativa
da reta (1) a partir de (2). Ou seja, o fato de ns s termos uma amostra leva a
desvios com relao estimativa dos parmetros. Dado que, com base na nossa
regresso estimada, o valor esperado de y ( ) :

Assim, os resduos so:

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 25 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

Bom pessoal, ns j temos uma estimativa de uma regresso, agora vocs podem
estar se perguntando: Ser que isso est bom? Ser que esta reta representa bem
a situao ocorrida no mundo real? Ns vamos estudar isso a seguir.

Exerccio 2

(FCC - ANALISTA BACEN 2005) Uma empresa com a finalidade de determinar


a relao entre os gastos anuais com propaganda (X), em R$ 1000,00, e o lucro
bruto anual (Y), em 1000,00, optou por utilizar o modelo linear simples Y(i) = a
+ bX(i) + e(i), em que Y(i) o valor do lucro bruto auferido no ano (i), X(i) o
valor do gasto com propaganda no ano (i) e e(i) o erro aleatrio com as
respectivas hipteses consideradas para a regresso linear simples.

Considerou, para o estudo, as seguintes informaes referentes s


observaes dos ltimos 10 anos da empresa:

Utilizando a equao da reta obtida pelo mtodo dos mnimos quadrados, tem-
se que, caso haja um gasto anual com propaganda de 80 mil reais, a previso
do lucro bruto anual, em mil reais, ser de:

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 26 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

a) 158

b) 128,4

c) 121

d) 102,5

e) 84

Resoluo

Bom, primeiramente, no caia na armadilha! Estes valores que o exerccio te deu


no esto centrados na mdia. Portanto, com base em propriedades estatsticas,
pode-se demonstrar que:

Assim, dadas as formas funcionais para clculo:

Pode-se inferir as estimativas:

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 27 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

Assim, temos a equao de reta. Substituindo X = 80, tem-se que:

7. Tabela ANOVA

Vamos l pessoal, de olho na aprovao!

Agora vamos falar sobre o grau de ajustamento de uma regresso. Isso , quanto
uma reta explica dos dados?

Bom, fcil pensar que h uma parcela da variao explicada pela regresso, ou
seja, aqueles parmetros que ns estimamos devem explicar parte da variao real
nas observaes da amostra, excluda a parte explicada pelos resduos.

-Professor, no entendi nada!

Ok. Acho que esta parte que fica mais intuitiva com a matemtica. E a, qual a
expresso que vocs acham que representa a parcela explicada por uma regresso
realizada com base em uma amostra? Claro que :

Dado que constante, ela no compe a parte da varincia explicada. Assim, com
o intuito de se definir uma expresso para a varincia explicada pode-se descart-
la:

Portanto, trata-se da parte estimada da reta que d o valor previsto de y para cada
x, que costumeiramente descrita como a varivel dependente com um acento
circunflexo em cima.

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 28 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

E a parte no explicada?

evidente que a soma de ambas as equaes geram a equao de reta original,


com a soma do comportamento dos resduos com a parte explicada. Assim,
precisaramos somar tais expresses para encontrar o total e, a partir da, tentar
entender como cada uma destas parcelas participam da formao do resultado.

Mas, sabendo-se que os resduos tm soma igual zero, o estudo ser feito com
base na soma dos quadrados dos resduos e, por conseqncia, com base na
soma dos quadrados explicados e na soma dos quadrados totais.

Vamos, primeiro, pelo mais fcil. A soma dos quadrados totais (SQT) :

Segue-se a Soma dos Quadrados Explicados (SQE):

E a Soma dos Quadrados dos Resduos (SQR):

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 29 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

Vocs esto entendendo o que ns estamos fazendo? Em termos bem leigos, ns


estamos decompondo o quanto uma regresso consegue explicar de quanto ela no
consegue! Ser que voc consegue pensar em um jeito de dizer, em termos
percentuais, o quanto uma regresso consegue explicar de uma srie de dados, ou
seja, o quanto a regresso estimada se aproxima do real processo gerador de
dados (equao (1))?

Beleza! A resposta fcil mesmo e dada por:

Este o famoso R ou coeficiente de determinao. Ele determina o quanto a


regresso est conseguindo refazer da srie original a partir de valores estimados.
Assim, a regresso ser bem ajustada quanto mais prximo este coeficiente se
aproximar de 1. Ou seja, um valor de 0,97 indica que a regresso estimada 97% da
varincia de y explicada por x.

Lembram-se do coeficiente de correlao amostral nas aulas de estatstica? Ento,


pode-se demonstrar que:

Esta , somente, uma das formas de se encontrar o R. Mas, ela j caiu vrias
vezes, ento, meus amigos, vou simplificar para vocs: decorem!

Agora podemos partir para a anlise da tabela ANOVA. A partir da definio de


SRT, SQT e SQE, iremos construir uma tabela que indica como as parcelas
decompostas variam ao redor da mdia da regresso como um todo e se todos os
coeficientes em conjunto tem capacidade de explicar a regresso, conforme
veremos a seguir.

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 30 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

Esta tabela chamada de ANOVA e tem o seguinte formato:

Quadrados
Soma dos Quadrados Graus de Liberdade Teste F
Mdios

SQE K

SQR Nk1

SQT N1

Sendo N o nmero de observaes da amostra e k o nmero de variveis


explicativas na regresso, assim, no caso da regresso simples, k = 1.

Novamente pessoal, vamos nos lembrar das aulas de Estatstica. Sendo SQR a
soma dos quadrados dos resduos e sua mdia igual a zero, se ns dividirmos tal
expresso pelos seus graus de liberdade, o que teramos?

O que isso? No a varincia? Exatamente! Trata-se de uma medida no


tendenciosa da varincia dos erros. Portanto, o quadrado mdio dos resduos
iguala a varincia dos erros. O mesmo pode ser dito com relao ao coeficiente
SQE/k, haja vista o mesmo medir tambm uma varincia, mas a varincia
explicada.

Bom, ns j temos a varincia dos erros e a varincia explicada pela regresso,


dada por , portanto cabe questionar: ser que a esta regresso faz sentido?

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 31 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08
No entendeu? Vamos l. Ns poderamos encontrar uma regresso na qual os
quadrados mdios dos resduos (varincia dos erros) representam a maior parte da
variabilidade da regresso, invalidando a representatividade da regresso como um
processo que poderia ter gerado aquelas variveis explicadas. Assim, a parte que
se constitui como uma reta (bx) s explicou alguma parte da varivel explicada por
coincidncia, isto , sem significncia estatstica.

Como ns podemos verificar isso? Por meio do teste F. O teste F um teste


estatstico que visa comparar varincias e se a diferena entre ambas
estatisticamente significante. Analiticamente, sob a hiptese nula, o quociente entre
dois quadrados mdios, isso , entre duas varincias, segue uma distribuio F.

A ttulo de ilustrao vamos nos utilizar da tabela ANOVA que ns construmos.


Portanto:

Sob a hiptese nula de que estas duas varincias so iguais, a estatstica de teste
segue uma distribuio F com k graus de liberdade no numerador e N - k 1 graus
de liberdade no denominador.

O que voc est buscando? Bom, quando voc estima uma regresso, voc busca
encontrar uma relao estatisticamente significante que explique o fenmeno que
est em estudo. Assim, se voc concluir que no h como rejeitar a hiptese nula
de que a varincia explicada pela sua regresso igual varincia dos resduos, na
verdade, voc no encontrou nada! Isso deriva do fato de que, se isso aconteceu,
muito provvel que toda parcela que voc conseguiu explicar da varivel
dependente foi por acaso, o que deve ter acontecido somente em virtude da
variao dos erros e no de uma especificao correta de uma reta. Ou seja, toda

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 32 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08
sua regresso no tem grande validade em termos de explicar a dinmica da
varivel dependente em estudo.

Portanto, o teste F aplicado ao estudo de regresso equivalente a um teste de


hipteses conjunto de que todos, ou parte de todos, os coeficientes tm valor igual
a zero.

Antes de encerrarmos o assunto sobre o teste F,


temos de ressaltar uma coisa importante. A teoria estatstica por detrs da
derivao do teste exige que a varivel y seja normalmente distribuda.

Todo mundo se lembra da distribuio normal das aulas de estatstica, certo? Trata-
se de uma distribuio de probabilidade, que associa determinado valor a
determinada probabilidade da seguinte forma:

J que y composto de uma parte fixa (reta) e de uma parte aleatria (erro), a
varincia da varivel explicada igual varincia do erro. Assim, a hiptese de
normalidade de y equivalente a se afirmar que o erro tem de ser normalmente
distribudo. Portanto, esta ser nossa segunda hiptese sobre o modelo de
regresso.

2 Hiptese sobre o modelo de regresso

Os erros so normalmente distribudos

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 33 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

Um exerccio para testar o seu conhecimento.

Exerccio 3.

(FCC - ANALISTA BACEN 2005) Uma empresa com a finalidade de determinar


a relao entre os gastos anuais com propaganda (X), em R$ 1000,00, e o lucro
bruto anual (Y), em 1000,00, optou por utilizar o modelo linear simples Y(i) = a
+ bX(i) + e(i), em que Y(i) o valor do lucro bruto auferido no ano (i), X(i) o
valor do gasto com propaganda no ano (i) e e(i) o erro aleatrio com as
respectivas hipteses consideradas para a regresso linear simples.

Considerou, para o estudo, as seguintes informaes referentes s


observaes dos ltimos 10 anos da empresa:

Montando o quadro de anlise de varincia (ANOVA), tem-se que:

a) a variao total apresenta um valor de 62,5.

b) a variao explicada, fonte de variao devido regresso, apresenta um


valor igual a 80.

c) Dividindo a variao residual pela variao total, obtemos o coeficiente de


determinao (R).

d) o valor da estatstica F necessria para o teste da existncia da regresso


igual ao quociente da diviso da variao explicada pela variao residual.

e) a variao residual apresenta um valor igual a 17,5.

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 34 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08
Resoluo

Vamos comear definindo SQT, SQE e SQR:

Assim, chega-se ao gabarito (e). Sabe-se que a alternativa (c) est incorreta porque
o R surge da diviso da variao explicada pela total, enquanto que a alternativa
(d) advm da diviso dos quadrados mdios explicados e dos resduos e no
somente da variao.

8. Teste de hipteses sobre os coeficientes

Na ltima seo ns vimos como o teste F avalia a hiptese conjunta de que todos
os coeficientes tm valor igual a zero. Agora vamos avaliar a significncia estatstica
dos coeficientes, um por um. Com efeito, vamos avaliar a significncia estatstica de
b isoladamente, tal como na equao (2)

- Pera professor, mas voc acabou de ensinar a aplicao do teste F na


regresso simples e disse que ele avalia a hiptese nula de que todos os
coeficientes so iguais a zero, ou seja, b igual a zero. Ento qual a diferena
deste teste de hipteses para o teste F?

Se voc pensou isso, parabns! J est a caminho de trabalhar na Receita.

Pois , realmente, no caso da regresso linear simples no h diferena. Mas, a


regresso simples no a nica forma de regresso possvel. Existe o caso da
regresso mltipla, que, no caso, depende de mais de um x. Por exemplo:

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 35 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08
Assim, por exemplo, as vendas de uma empresa podem ser funo no somente
dos gastos em propaganda, mas tambm do investimento em treinamento de
pessoal, da parcela do mercado dominada por ela, etc. Este um caso de
Regresso Linear Mltipla.

Neste caso, fcil perceber que o resultado do teste F no equivalente ao


encontrado nos testes de hiptese sobre b. O teste de hipteses sobre os
coeficientes analisa a significncia estatstica de cada coeficiente isoladamente,
enquanto que o teste F analisa a significncia estatstica conjunta de todos os
coeficientes ao mesmo tempo.

Ento meus amigos, agora que vocs entenderam o porqu do teste de hipteses,
alm do teste F, vamos entender como operacionaliz-lo.

A idia bsica do teste de hipteses afirmar se a ocorrncia de um evento tem


uma probabilidade estatstica significante, dado um valor de significncia, ou seja,
um valor que seria considerado muita coincidncia.

Vamos para um exemplo prtico de nossa aula. Com base na nossa amostra e na
regresso estimada, ser que os gastos em propaganda realmente afetam as
vendas da empresa? Isso seria equivalente a estipular duas hipteses, uma
hiptese nula e outra alternativa de tal forma que:

A estatstica de teste deve ser calculada da seguinte forma:

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 36 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

Sendo s o valor estimado para o desvio padro do parmetro, que, por se tratar de
uma amostra, desconhecida.2

A estimativa para a varincia de b dada por:

Ao calcular a estatstica de teste, cabe compar-la com o valor tabelado da


distribuio t de Student, distribuio esta que utilizada para os casos em que a
varincia populacional no conhecida. Assim, preciso fazer o clculo acima e
consultar tabela t com N-k-1 graus de liberdade e com a significncia estatstica que
voc achar conveniente.3 Olhe o grfico abaixo.

Caso o valor calculado seja inferior ao valor tabelado, isto significa que no
possvel rejeitar a hiptese nula de que o coeficiente da reta igual a zero,

2
Lembrem-se, o desvio padro igual raiz quadrada da varincia.

3
A consulta na tabela ir depender dos graus de liberdade dos quadrados mdios dos resduos e da
significncia estatstica que o pesquisador achar relevante, como 5%, por exemplo, o que se escreve como
t(N-k-1, 5%).

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 37 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08
situando-se dentro da rea branca do grfico acima. Olha pessoal, o que se est
dizendo com isso que, dado um valor considerado improvvel (rea cinza), a
estatstica nos permite dizer se este valor est dentro destes padres esperados.

Caso o valor calculado supere o valor tabelado (rea cinza grfico), rejeita-se a
hiptese nula de que o coeficiente igual a zero. Ou seja, como aquele cantinho
improvvel no caso de a hiptese nula ser verdadeira e como a estatstica de teste
nos diz que o valor encontrado est l, a hiptese nula deve estar errada.
Entenderam?

A idia bsica deste teste de hipteses sobre os parmetros da regresso avaliar


se estes ltimos apresentam significncia estatstica. Se o teste de hipteses indicar
que o parmetro da equao (2) tem valor igual a zero, deve-se pensar em outra
forma funcional, com outra(s) varivel(is) explicativa(s), para explicar a varivel y.
Em outras palavras, uma concluso deste tipo indica que os gastos em propaganda
no afetam as vendas, devendo-se excluir tal varivel.

Uma coisinha: tal como no caso do teste F, a avaliao destes coeficientes por
meio de testes de hipteses exige que os erros sejam normalmente distribudos.

9. Eficincia do estimador de Mnimos Quadrados Ordinrios (MQO)

Vamos l, lembram-se das 2 hipteses que dissemos ser necessrias para a


atividade de anlise de regresso?

Ento, vamos l! As hipteses do modelo de regresso linear j estipuladas so:

1 Hiptese sobre o modelo de regresso linear

2 Hiptese sobre o modelo de regresso linear

Os erros so normalmente distribudos

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 38 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

Veja, tudo que ns discutimos na seo anterior tem a ver com o estimador MQO.
Uma caracterstica importante para um estimador a sua ausncia de vis. Quando
eu digo vis exatamente isso que vocs esto pensando. Ao afirmar que a
opinio de uma pessoa sobre determinado assunto enviesada, voc est
dizendo que ela est se distanciando dos fatos da realidade e puxando a sardinha
para uma determinada concluso.

Se eu digo para vocs que um estimador no viesado, eu estou dizendo que, na


mdia, ele acerta, ou seja, d o valor real do parmetro. Vou repetir um
pouquinho da seo anterior, s para vocs lembrarem.

Um exemplo para vocs entenderem, suponha um fenmeno que se comporte


conforme a regresso mltipla abaixo:

Esta equao pode representar o fenmeno de vendas de uma empresa (y)


explicadas pelo seu gasto com propaganda ( ) por cada uma de suas filiais ( ).
Porm, dado que ns s temos uma amostra dos dados que compem esta relao,
ns iremos estimar esta reta por meio de MQO, tal como na seo anterior, o que
nos levar seguinte relao:

Perceba que e so as estimativas de e para uma dada amostra de dados


da populao. Algo intuitivo, mas que importante destacar que b mede a
alterao em y para uma dada variao em x, mantido tudo mais constante, ou
como os economistas chamam coeteris paribus.

Agora, a pergunta : ser que, na mdia, estes estimadores se aproximam do valor


real do parmetro? Pronto, agora voc vai entender o que vis de um estimador.

Meus amigos, ser no viesado se:

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 39 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

Isto quer dizer, a esperana do estimador igual ao seu correspondente parmetro


populacional. S para lembr-los das aulas de Estatstica, quando voc falar em
esperana de uma varivel, tire a sua mdia e pronto! Vocs no precisam saber
mais do que isso para sua prova.

Bom, falamos um monte para chegarmos seguinte pergunta: quais as condies


necessrias para que o estimador de MQO seja no viesado? A resposta para esta
pergunta depende de uma demonstrao matemtica que se utiliza do operador
esperana.

-Professor, esta demonstrao cai na prova?

Quem pensou assim um verdadeiro concurseiro, com meio caminho andado para
sua aprovao. Voc tem que ser objetivo e focar em resultados e no em
perfumarias. Se voc gostar muito de Estatstica e quiser aprender isso, passe no
concurso e v fazer um Mestrado ou Doutorado depois, agora, pense no concurso.
Mas, quem quiser dar uma olhada na demonstrao, d uma olhada no livro do meu
orientador de doutorado, Rodolfo Hoffmann, Anlise de Regresso: uma
introduo Econometria.

Ento, vamos direto ao ponto. Para garantir o no vis de um estimador de uma


regresso linear, assuma a 1 hiptese do modelo de regresso linear e
acrescente:

3 Hiptese sobre o modelo de regresso linear

Ou seja, os no so correlacionados com os erros

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 40 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

Obs. Pessoal, eu j vi autores dizendo por a que a


normalidade dos erros condio necessria para que o estimador MQO seja no
viesado. Cuidado! No caso da ESAF, a mesma considera que tal hiptese no
necessria. De acordo com as provas da banca, podemos perceber que eles
consideram que a no normalidade dos erros s afeta os testes de hipteses.

O que ns estamos dizendo aqui? Vejamos, vamos ao exemplo dos gastos em


propaganda.

Os erros na equao original poderiam representar a fatia de mercado j dominada


pela empresa. Se os gastos em propaganda forem uma parcela fixa do total que a
empresa vende, estes gastos seriam cada vez maiores quanto maiores fossem as
vendas. Neste sentido, o que poderia estar afetando as vendas seria a fatia de
mercado j dominada pela empresa e no os gastos em propaganda. Assim, o
efeito b encontrado para os gastos em propaganda poderia estar contaminado e ser
esprio (isso , no representar nada), dado que quanto maior a fatia de mercado,
maior seriam os gastos em propaganda e, por conseqncia do aumento na fatia de
mercado e no dos gastos em propaganda, maiores seriam as vendas.

Assim, aquelas 2 condies so necessrias para se concluir que o estimador MQO


seja no viesado.

Bom, mas isso no basta para provar que um estimador eficiente.

- Professor, o que um estimador eficiente?

aquele que possui a menor a menor varincia dentre todos os estimadores


lineares no viesados. O que bastante bvio, dado que se seu estimador no
viesado, o que voc busca que o mesmo possua varincia mnima, de modo a se
aproximar ao mximo do parmetro populacional.

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 41 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08
Voc garante que um estimador o melhor estimador linear no viesado, ou, como
conhecido na literatura especializada, BLUE (best linear unbiased estimator) por
meio da satisfao das condies do Teorema de Gauss Markov.

Novamente, vocs no tm que saber como derivar tal teorema (no livro do Prof.
Hoffmann voc tambm encontra tal demonstrao), ento vamos direto ao que
interessa. As pressuposies so as mesmas necessrias para garantir o no vis e
mais estas duas:

4 hiptese sobre o modelo de regresso linear:

5 hiptese sobre o modelo de regresso linear:

Ou seja, os erros no so autocorrelacionados.

Pessoal, todas estas hipteses e suas violaes no precisam ser


aprofundadas para sua prova, apenas decore!

S para explicar melhor, no caso da 4 hiptese, o que se quer garantir que os


erros tem varincia constante ao longo da amostra. Por exemplo, pode-se encontrar
um erro que se comporte de tal forma que:

Se isso ocorrer, voc concorda que a varincia ser funo do valor da varivel
explicativa e, portanto, no constante? Se isso ocorrer, surgiro problemas na
anlise de regresso, conforme ser discutido mais adiante. Quando a varincia dos
erros no constante, chamamos a este problema de heterocedasticidade.

Quanto 5 hiptese, espera-se que os erros do perodo presente no guardem


relao com os erros do perodo passado. Com efeito, os erros observados nas
estimativas MQO no perodo t no podem influenciar os erros de estimativa no
perodo t+1. Para entender melhor, substitua t por um determinado ano, 2010, por

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 42 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08
exemplo, e pense sobre isso. Caso isso no ocorra, dizemos que o modelo possui
autocorrelao.

Vocs lembram de que eu disse que, por enquanto, estamos trabalhando com
dados em cortes transversais, ou seja, com observaes para diferentes unidades
no mesmo perodo de tempo (como no caso dos gastos com propaganda, que
avaliamos diferentes empresas em um nico ponto do tempo, um ano, por
exemplo)? Ento, a hiptese 5, na maior parte dos casos, s violada quando
estamos trabalhando com sries de tempo, ou seja, observaes para uma mesma
unidade em diferentes perodos do tempo (seria o equivalente a avaliar a questo
dos gastos com propaganda em uma nica empresa, mas ao longo do tempo).

Ento, se estas hipteses estiverem valendo, voc pode dizer que sua Regresso
Linear Simples BLUE.

Ufa! Falamos para burro ao longo deste curso, portanto chega de conversa e
vamos fazer exerccios.

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 43 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

Exerccio 4

(SUSEP 2010 Aturia) A partir de uma amostra aleatria [x(1), y(1)], [x(2),
y(2)]...[x(20), y(20)] foram obtidas as estatsticas:

Mdia de X = 12,5

Mdia de Y = 19

Varincia de X = 30

Varincia de Y = 54

Covarincia entre X e Y = 36

Calcule a reta de regresso estimada de Y contra X.

a) Y = 19 + 0,667*X

b) Y = 12,5 + 1,2*X

c) Y = 4 + 1,2 X

d) Y = 19 + 1,2 X

e) Y = 80 + 22,8X

Resoluo

Vamos l!

Com base neste resultado:

Assim:

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 44 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

Exerccio 5

(SUSEP 2010 Aturia) Com os dados da questo anterior, determine o valor


da estatstica F para testar a hiptese nula de que o coeficiente angular da reta
do modelo de regresso linear simples de Y contra X igual a zero.

a) 144

b) 18

c) 36

d) 72

e) 48

Resoluo

Bom, essa complicada. Agora vamos ter que para pensar um pouquinho. Vamos
nos relembrar de como calculada a estatstica F:

Se ns dividirmos o numerador e o denominador pelo mesmo nmero, o total da


frao permanece a mesma. Assim, vamos dividir os dois membros por SQT:

Viram? Esta uma forma muito importante de se definir o clculo do R. Decorem!

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 45 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

Com base nas varincias de x e y e na estimativa do parmetro b, possvel


encontrar o R. Vejamos:

O que pode ser obtido pela seguinte propriedade estatstica:

Se .

Pense comigo, vamos explicitar a funo em termos das variveis centradas na


mdia:

O que acontece se ns dividirmos o numerador e o denominador por (N-1), sendo N


o nmero de observaes da regresso (deixando o resultado final inalterado)?
isso! Voc ter a varincia de x e y, pois (N-1) o nmero de graus de liberdade da
varincia destas variveis. Assim:

Decore isso! Agora fcil:

Calculando a estatstica F, chega-se a:

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 46 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

Exerccio 6

(ESAF AFRFB 2009) Na anlise de regresso linear simples, as estimativas

e dos parmetros e da reta de regresso podem ser obtidas pelo


mtodo de Mnimos Quadrados. Nesse caso, os valores dessas estimativas
so obtidos atravs de uma amostra de n pares de valores com (i = 1,

2,....,n), obtendo-se: , onde a estimativa de .


Para cada par de valores com (i = 1, 2,...,n) pode-se estabelecer o desvio
ou resduo - aqui denotado por - entre a reta de regresso e sua

estimativa . Sabe-se que o Mtodo de Mnimos Quadrados consiste em


adotar como estimativas dos parmetros e os valores que minimizam a
soma dos quadrados dos desvios . Desse modo, o Mtodo de Mnimos
Quadrados consiste em minimizar a expresso dada por:

a)

b)

c)

d)

e)

Resoluo
Pessoal, o que faz o mtodo do MQO?
Isso mesmo! Ele minimiza a soma dos quadrados dos resduos. Portanto, fcil
perceber que a expresso que mostra isso, dada a notao usada na questo, :

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 47 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

O gabarito (a), mas est incorreto, pois deveria haver um sinal de + antes de .
Portanto, foi anulada.

Exerccio 7

(EPE ECONOMIA DA ENERGIA/2007) Qual das afirmaes abaixo faz


referncia correta ao modelo de regresso linear simples?
a) Toda regresso apresenta heterocedasticidade
b) Se a varincia dos erros constante, os dados so homocedsticos
c) O intercepto representa a inclinao da reta
d) Os erros do modelo no so aleatrios, com esperana igual a 1
e) A constante sempre positiva

Resoluo
Essa bem fcil. A alternativa (b) a definio de homocedasticidade.

S para destacar, , o intercepto, no a inclinao da reta, mas somente o valor


no qual a reta tangencia o eixo vertical. A inclinao dada por .

Exerccio 8

(ESAF ATRFB/2009) O modelo de Regresso Linear Mltipla Y = + X+ Z


+ ajustado s observaes (Y, X, Z) que constituem uma amostra aleatria
simples de tamanho 23. Considerando que o coeficiente de determinao foi
R = 0,80, obtenha o valor mais prximo da estatstica F para testar a hiptese
nula de no existncia da regresso:
a) 84
b) 44
c) 40
d) 42
e) 80

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 48 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

Resoluo
Vamos aplicar a frmula do teste F:

Alternativa (c).

(ANPEC 2010) Julgue as afirmativas

Exerccio 9

Os estimadores de MQO so eficientes, mesmo se os erros no forem


normalmente distribudos.

Resoluo

Verdadeira! Como eu disse, controvrsias parte, mesmo que os erros no sejam


normalmente distribudos, a eficincia do estimador no afetada.

Exerccio 10

Sob heterocedasticidade os estimadores de MQO so viesados.

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 49 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

Resoluo

Incorreta. Conforme vimos, a homocedasticidade hiptese necessria para


garantir eficincia e confiabilidade nos testes de hipteses, no afetando o vis.

Exerccio 11

Sob autocorrelao o estimador de MQO no mais eficiente.

Resoluo

Perfeito. Esta uma das condies necessrias impostas pelo Teorema de Gauss-
Markov, que demonstra que o estimador MQO BLUE.

(ANAC NCE/2007 ADAPTADA) Considerando o modelo abaixo, estimado


pelo mtodo de mnimos quadrados ordinrios, com uma amostra de 300
observaes, com:

R= 0,39

P = 30,0 + 20,0Q + 10,0V + u


(3,0) (2,2) (0,9)

P o preo de venda dos apartamentos em uma determinada cidade (em mil


reais), Q o nmero de quartos do apartamento, V o nmero de varandas, u o
erro e os valores entre parntesis so os desvios-padro dos coeficientes
estimados. Com base nisso, julgue os itens a seguir.

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 50 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

Questo 12

O preo esperado de um apartamento com 2 quartos e uma varanda ser


maior que R$ 80.000, pois no conhecemos o valor esperado de u.

Resoluo

Pessoal, substituam:

O preo no maior que 80. Alternativa falsa.

Questo 13

Segundo o coeficiente de determinao, mais da metade da variao dos


preos dos apartamentos pode ser explicada.

Resoluo

Gente, a alternativa est falando do R. No caso, ele de 39%, portanto no explica


mais da metade da variao dos preos. Alternativa Falsa.

Questo 14

Atravs da observao do valor do R2, podemos concluir que a regresso


estatisticamente no-significante.

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 51 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

Resoluo

J discutimos isso. O R to somente um coeficiente de determinao e no nos


diz nada sobre a significncia de uma regresso. Isso para o teste F. Alternativa
falsa.

Exerccio 15

(AFRFB ESAF/2013) A expectncia de uma varivel aleatria x mdia ou


esperana matemtica como tambm chamada igual a 2, ou seja: E(x) =
2. Sabendo-se que a mdia dos quadrados de x igual a 9, ento os valores da
varincia e do coeficiente de variao de x so, respectivamente,
iguais a:

a)
b)

c)

d)

e)

Resoluo

Para resolvermos esta questo precisamos nos lembrar de que:

Assim:

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 52 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

Agora, fica fcil achar o coeficiente de variao:

Alternativa (a)

Exerccio 16

(AFRFB ESAF/2013) Um modelo de regresso linear mltipla foi estimado


pelo mtodo de Mnimos Quadrados, obtendo-se, com um nvel de confiana
de 95%, os seguintes resultados:

I. = 10 + 2,5*x1 + 0,3*x2 + 2*x3


II. o coeficiente de determinao R2 igual a 0,9532
III. o valor-p = 0,003

Desse modo, pode-se afirmar que:


a) se a varivel x1 for acrescida de uma unidade, ento Y ter um acrscimo
de 2,5 %.
b) 0,003 o mais baixo nvel de significncia ao qual a hiptese nula pode ser
rejeitada.
c) x3 explica 95,32% das variaes de Y em torno de sua mdia.
d) as probabilidades de se cometer o Erro Tipo I e o Erro Tipo II so,
respectivamente, iguais a 5% e 95%.
e) se no teste de hipteses individual para 2 se rejeitar a hiptese nula (H0),
ento tem-se fortes razes para acreditar que x2 no explica Y.

Resoluo

Vamos analisar uma a uma:


A se a varivel x1 for acrescida em uma unidade Y aumentar em 2,5, no em
percentual.

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 53 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08
B Perfeito, esta a definio de p-valor.
C O R no para x3, mas para a regresso toda.
D Alternativa sem sentido
E Errado, a rejeio da hiptese nula indica a significncia do respectivo
coeficiente.

Exerccio 17

(FINEP CESGRANRIO/2011) O modelo de regresso linear Y = X + erro,


onde (X, Y) so pares de dados observados e um parmetro a ser
estimado, foi ajustado aos dados (X, Y) mostrados na figura abaixo.

Foi usada a tcnica de minimizar a soma dos erros quadrticos para ajustar a
reta de regresso, a qual
a) passa por ( ), onde e so as mdias de X e de Y.
b) passa pela origem (0, 0).
c) no a nica reta que minimiza a soma dos erros quadrticos.
d) tem varincia esperada nula.
e) tem coeficiente angular necessariamente negativo.

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 54 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

Resoluo

Vamos analisar cada uma das alternativas:


A no necessariamente, no h nada que garanta isso
B Correto. Devido ao fato de o modelo ser dado por , no h
intercepto, portanto, quando , ser igual zero tambm.
C Errado, estamos estudando o caso em que s h uma reta que minimiza a
soma dos quadrados dos erros.
D Nada garante isso.
E O coeficiente angular tem o mesmo sinal da associao entre as variveis,
ento, no presente caso, o mesmo positivo. Olhe no grfico!

Exerccio 18

(FINEP CESGRANRIO/2011) Se o coeficiente de correlao entre duas


variveis X e Y for nulo, ento a(s)
a) covarincia entre X e Y nula.
b) mdia de X nula.
c) mdia de Y nula.
d) mdias de X e Y so iguais.
e) varincias de X e de Y so no correlacionadas.

Resoluo

Essa muito fcil! Lembre-se da frmula do coeficiente de correlao:

Portanto, quando a correlao for nula, a covarincia tambm o ser. Alternativa (a).

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 55 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

Lista de Exerccios Resolvidos

Exerccio 4

(SUSEP 2010 Aturia) A partir de uma amostra aleatria [x(1), y(1)], [x(2),
y(2)]...[x(20), y(20)] foram obtidas as estatsticas:

Mdia de X = 12,5

Mdia de Y = 19

Varincia de X = 30

Varincia de Y = 54

Covarincia entre X e Y = 36

Calcule a reta de regresso estimada de Y contra X.

a) Y = 19 + 0,667*X

b) Y = 12,5 + 1,2*X

c) Y = 4 + 1,2 X

d) Y = 19 + 1,2 X

e) Y = 80 + 22,8X

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 56 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

Exerccio 5

(SUSEP 2010 Aturia) Com os dados da questo anterior, determine o valor


da estatstica F para testar a hiptese nula de que o coeficiente angular da reta
do modelo de regresso linear simples de Y contra X igual a zero.

a) 144

b) 18

c) 36

d) 72

e) 48

Exerccio 6

(ESAF AFRFB 2009) Na anlise de regresso linear simples, as estimativas

e dos parmetros e da reta de regresso podem ser obtidas pelo


mtodo de Mnimos Quadrados. Nesse caso, os valores dessas estimativas
so obtidos atravs de uma amostra de n pares de valores com (i = 1,

2,....,n), obtendo-se: , onde a estimativa de .


Para cada par de valores com (i = 1, 2,...,n) pode-se estabelecer o desvio
ou resduo - aqui denotado por - entre a reta de regresso e sua

estimativa . Sabe-se que o Mtodo de Mnimos Quadrados consiste em


adotar como estimativas dos parmetros e os valores que minimizam a
soma dos quadrados dos desvios . Desse modo, o Mtodo de Mnimos
Quadrados consiste em minimizar a expresso dada por:

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 57 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

a)

b)

c)

d)

e)

Exerccio 7

(EPE ECONOMIA DA ENERGIA/2007) Qual das afirmaes abaixo faz


referncia correta ao modelo de regresso linear simples?
a) Toda regresso apresenta heterocedasticidade
b) Se a varincia dos erros constante, os dados so homocedsticos
c) O intercepto representa a inclinao da reta
d) Os erros do modelo no so aleatrios, com esperana igual a 1
e) A constante sempre positiva

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 58 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

Exerccio 8

(ESAF ATRFB/2009) O modelo de Regresso Linear Mltipla Y = + X+ Z


+ ajustado s observaes (Y, X, Z) que constituem uma amostra aleatria
simples de tamanho 23. Considerando que o coeficiente de determinao foi
R = 0,80, obtenha o valor mais prximo da estatstica F para testar a hiptese
nula de no existncia da regresso:
a) 84
b) 44
c) 40
d) 42
e) 80

(ANPEC 2010) Julgue as afirmativas

Exerccio 9

Os estimadores de MQO so eficientes, mesmo se os erros no forem


normalmente distribudos.

Exerccio 10

Sob heterocedasticidade os estimadores de MQO so viesados.

Exerccio 11

Sob autocorrelao o estimador de MQO no mais eficiente.

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 59 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

(ANAC NCE/2007 ADAPTADA) Considerando o modelo abaixo, estimado


pelo mtodo de mnimos quadrados ordinrios, com uma amostra de 300
observaes, com:

R= 0,39

P = 30,0 + 20,0Q + 10,0V + u


(3,0) (2,2) (0,9)

P o preo de venda dos apartamentos em uma determinada cidade (em mil


reais), Q o nmero de quartos do apartamento, V o nmero de varandas, u o
erro e os valores entre parntesis so os desvios-padro dos coeficientes
estimados. Com base nisso, julgue os itens a seguir.

Questo 12

O preo esperado de um apartamento com 2 quartos e uma varanda ser


maior que R$ 80.000, pois no conhecemos o valor esperado de u.

Questo 13

Segundo o coeficiente de determinao, mais da metade da variao dos


preos dos apartamentos pode ser explicada.

Questo 14

Atravs da observao do valor do R2, podemos concluir que a regresso


estatisticamente no-significante.

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 60 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

Exerccio 15

(AFRFB ESAF/2013) A expectncia de uma varivel aleatria x mdia ou


esperana matemtica como tambm chamada igual a 2, ou seja: E(x) =
2. Sabendo-se que a mdia dos quadrados de x igual a 9, ento os valores da
varincia e do coeficiente de variao de x so, respectivamente,
iguais a:

a)
b)

c)

d)

e)

Exerccio 16

(AFRFB ESAF/2013) Um modelo de regresso linear mltipla foi estimado


pelo mtodo de Mnimos Quadrados, obtendo-se, com um nvel de confiana
de 95%, os seguintes resultados:

I. = 10 + 2,5*x1 + 0,3*x2 + 2*x3


II. o coeficiente de determinao R2 igual a 0,9532
III. o valor-p = 0,003

Desse modo, pode-se afirmar que:


a) se a varivel x1 for acrescida de uma unidade, ento Y ter um acrscimo
de 2,5 %.
b) 0,003 o mais baixo nvel de significncia ao qual a hiptese nula pode ser
rejeitada.
c) x3 explica 95,32% das variaes de Y em torno de sua mdia.

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 61 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08
d) as probabilidades de se cometer o Erro Tipo I e o Erro Tipo II so,
respectivamente, iguais a 5% e 95%.
e) se no teste de hipteses individual para 2 se rejeitar a hiptese nula (H0),
ento tem-se fortes razes para acreditar que x2 no explica Y.

Exerccio 17

(FINEP CESGRANRIO/2011) O modelo de regresso linear Y = X + erro,


onde (X, Y) so pares de dados observados e um parmetro a ser
estimado, foi ajustado aos dados (X, Y) mostrados na figura abaixo.

Foi usada a tcnica de minimizar a soma dos erros quadrticos para ajustar a
reta de regresso, a qual

a) passa por ( ), onde e so as mdias de X e de Y.


b) passa pela origem (0, 0).
c) no a nica reta que minimiza a soma dos erros quadrticos.
d) tem varincia esperada nula.
e) tem coeficiente angular necessariamente negativo.

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 62 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

Exerccio 18

(FINEP CESGRANRIO/2011) Se o coeficiente de correlao entre duas


variveis X e Y for nulo, ento a(s)
a) covarincia entre X e Y nula.
b) mdia de X nula.
c) mdia de Y nula.
d) mdias de X e Y so iguais.
e) varincias de X e de Y so no correlacionadas.

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 63 de 64


Estatstica p/ AFRFB
Teoria e exerccios comentados
Prof. Jeronymo Marcondes Aula 08

2-d
3-e
4-c
5-d
6-anulada
7-b
8-c
9-Certo
10-Errado
11-Certo
12-Errado
13-Errado
14-Errado
15-a
16-b
17-b
18-a

Encerramos a parte terica pessoal! Espero que vocs tenham gostado do


curso e, desde j, me coloco disposio para tirar qualquer dvida de
Estatstica/Econometria/Economia. Tenho certeza que aqueles que se
esforaram sero recompensados em breve! Lembre-se do que um professor
meu dizia: s no passa quem desiste. Mandem dvidas e boa sorte!

jeronymo@estrategiaconcursos.com.br

Prof. Jeronymo Marcondes www.estrategiaconcursos.com.br 64 de 64

You might also like