You are on page 1of 24

UNIVERSIDADE FEDERAL

DA PARABA

Correlao e Regresso
Luiz Medeiros de Araujo Lima Filho
Departamento de Estatstica

Introduo
Existem situaes nas quais h interesse em estudar o
comportamento conjunto de uma ou mais variveis;
Em muitos casos, a explicao de um fenmeno de interesse
pode estar associado a outros fatores (variveis) que
contribuem de algum modo para a ocorrncia deste fenmeno.
O comportamento conjunto de duas variveis quantitativas
pode ser observado por meio do grfico de disperso.
x

Introduo

Exemplo

Para desenhar um diagrama de disperso, necessrio sempre fazer o eixo cartesiano para
identificar os pontos das variveis quantitativas consideradas.
Representa-se primeiramente uma das variveis no eixo das abscissas (varivel X) e a outra
varivel no eixo das ordenadas (varivel Y).

x
Os valores das variveis so marcados sob os respectivos eixos
e assim marca-se um ponto
para cada par de valores.

Exemplo

Correlao e Regresso
So duas tcnicas estreitamente relacionadas, que visa
estimar uma relao que possa existir entre duas variveis na
populao.
Correlao: resume o grau de relacionamento entre
duas variveis (X e Y, por exemplo).
Regresso: tem como resultado uma equao
matemtica que descreve o relacionamento entre variveis.
x

Correlao
O objetivo do estudo da correlao determinar (mensurar) o grau de
relacionamento entre duas variveis.
Caso os pontos das variveis, representados num plano cartesiano (X, Y)
ou grfico de disperso, apresentem uma disperso ao longo de uma reta
imaginria, dizemos que os dados apresentam uma correlao linear.

Coeficiente de correlao linear de Pearson


Uma medida do grau e do sinal da correlao linear entre
duas variveis (X,Y) dado pelo Coeficiente de Correlao
Linear de Pearson, definido por:

O valor de r estar sempre no intervalo de -1 a 1.


x

Propriedades do Coeficiente de Correlao Linear


Este coeficiente adimensional, logo no afetado pelas unidades de
medidas das variveis X e Y.
O sinal positivo indica que as variveis so diretamente proporcionais,
enquanto que o sinal negativo indica que a relao entre as variveis
inversamente proporcional.

Exemplo 1:
A tabela abaixo apresenta os preos mdios das aes e ttulos divulgados
pela Bolsa de Nova York entre 1950 e 1959. Calcule o coeficiente de
correlao de Pearson e interprete o resultado.

Exemplo 2: Existe correlao entre o nmero de faltas e a


nota final? De que forma?

Nota final

Faltas
95
90
85
80
75
70
65
60
55
50
45
40

8
10
Faltas
X

12

14

16

x
8
2
5
12
15
9
6

Nota
final

y
78
92
90
58
43
74
81

REGRESSO
Quando analisamos dados que sugerem a existncia de uma relao
funcional entre duas variveis, surge ento o problema de se determinar
uma funo matemtica que exprima esse relacionamento, ou seja, uma
equao de regresso.
Ao imaginar uma relao funcional entre duas variveis, digamos X e Y,
estamos interessados numa funo que explique grande parte da variao
de Y por X. Entretanto, uma parcela da variabilidade de Y no explicada
por X ser atribuda ao acaso, ou seja, ao erro aleatrio.
Quando se estuda a variao de uma varivel Y em funo de uma
varivel X, dizemos que Y a varivel dependente e que X a varivel
explanatria (ou independente).
x

O modelo em que busca explicar uma varivel Y como uma funo


linear de apenas uma varivel X denominado de modelo de regresso
linear simples.

Varivel independente, X

Varivel dependente, Y

Temperatura do forno (C)

Resistncia mecnica da cermica (MPa)

Quantidade de aditivo (%)

Octanagam da gasolina

Renda(R$)

Consumo(R$)

Memria RAM do computador (Gb) Tempo de resposta do sistema (s)


rea construda do imvel (m2)

Preo do imvel (R$)

REGRESSO LINEAR SIMPLES

ESTIMAO DOS PARMETROS


O objetivo estimar valores para e atravs dos dados fornecidos pela
amostra. Alm disso, encontrar a reta que passe o mais prximo possvel
dos pontos observados segundo um critrio pr-estabelecido.

MTODO DOS MNIMOS QUADRADOS


usado para estimar os parmetros do modelo ( e ) e consiste
em fazer com que a soma dos erros quadrticos seja menor
possvel, ou seja, este mtodo consiste em obter os valores de e
que minimizam a expresso:

Aplicando-se derivadas parciais expresso acima, e igualando-se


a zero, acharemos as estimativas para e .
x

MTODO DOS MNIMOS QUADRADOS


Aps aplicar as derivadas parciais, e igualando-se a zero,
possvel obter as seguintes estimativas para e , as quais
chamaremos de a e b, respectivamente:

A chamada equao (reta) de regresso dada por

e para cada valor xi (i = 1, ..., n) temos, pela equao de


regresso, o valor predito:

A diferena entre os valores observados e os preditos ser


chamada de resduo do modelo de regresso, sendo denotado
por:

O resduo relativo i-sima observao (ei) pode ser


considerado uma estimativa do erro aleatrio (ei), como
ilustrado abaixo.

COEFICIENTE DE DETERMINAO (R2)


O coeficiente de determinao uma medida descritiva da
proporo da variao de Y que pode ser explicada por
variaes em X, segundo o modelo de regresso
especificado. Ele dado pela seguinte razo:

Quanto mais prximo de 1 estiver o coeficiente de determinao, melhor


ser o grau de explicao da variao de Y em termos da varivel X.
uma medida sempre positiva, e obtida, na regresso linear simples,
elevando-se o coeficiente de correlao de pearson ao quadrado.

EXEMPLO 3:

ndice de octanagem

Considere um experimento em que se analisa a octanagem da gasolina (Y) em


funo da adio de um novo aditivo (X). Para isso, foram realizados ensaios
com os percentuais de 1, 2, 3, 4, 5 e 6% de aditivo. Os resultados so
mostrados no grfico de disperso.

86
85
84
83
82
81
80
0

Quantidade de aditivo (%)

a)
b)
c)
d)

Existe uma relao linear entre a adio de um novo aditivo e a


octanagem da gasolina? Qual o grau dessa relao?
Determine a reta de regresso que explica a octanagem da gasolina em
funo da adio do novo aditivo. Calcule o coeficiente de determinao
do modelo.
Se adicionarmos 5,5% de aditivo, qual o ndice de octanagem esperado?
Calcule o erro de estimao para cada valor de X.

EXEMPLO 4:

Quantidade de procana hidrolisada, em 10 moles/litro, no plasma humano,


em funo do tempo decorrido aps sua administrao.

a)

Existe uma relao linear entre a quantidade de procana e o tempo


decorrido aps sua administrao? Qual o grau dessa relao?

b)

Determine a reta de regresso que explica a quantidade de procana em


funo do tempo. Calcule o coeficiente de determinao do modelo.

c)

Qual a quantidade de procana hidrolisada aps 6 minutos de sua


administrao? E aps 13 minutos?

d)

Calcule o erro de estimao para cada valor de X.

Exemplo 5:
A tabela abaixo apresenta os preos mdios das aes e ttulos divulgados pela
Bolsa de Nova York entre 1950 e 1959. Calcule o coeficiente de correlao de
Pearson e interprete o resultado.

a)

Determine a reta de regresso que explique os ttulos divulgados em funo do preo


mdio das aes. Calcule o coeficiente de determinao do modelo.

b)

Qual o nmero de ttulos divulgados para um preo mdio da ao de 45,00? E para um


preo mdio de 50,00?

c)

Calcule o erro de estimao para cada valor de X.

REGRESSO LINEAR MLTIPLA


Em algumas situaes o interesse estudar o comportamento de uma
varivel dependente Y em funo de duas ou mais variveis independentes
Xi.

Os mtodos para tratar com o problema de prever uma varivel por meio
de diversas outras so semelhantes queles
para uma varivel
x
independente.

You might also like