You are on page 1of 6

05/09/2007

Correlacinyregresin
A menudo es interesante estudiar la relacin entre dos variables de una poblacin o muestra.
= 0.05 = 0.01

Acepto la Ho

Anlisis de correlacin, mide la intensidad o fuerza de las relaciones, o sea el grado de asociacin de las variables. variables Anlisis de regresin, mide la naturaleza de la relaciones entre las variables.

y = + .x + = a + bxi y

Dr.AlfredoMatosCh. FacultaddeIngeniera UniversidadPeruanaUnin alfredom@upeu.edu.pe

Cuando el estudio se limita a dos variables, se denomina anlisis de correlacin simple y anlisis de regresin simple.

2 =

2 2 2 2 2

2 recibeelnombredecoeficientede Elparmetro correlacinypuedeserestimadoporr2

Factor2

2 2 = 2 2 2
2

r=

s xy s xx s yy

sxy =
Factor1
i =1

n n xi yi xi x yi y = xi yi i =1 i =1 n i =1

)(

r=

s xy sxx s yy

Suposicionesquefundamentanelmodelode Correlacin
2

s xx =
i =1

n 2 xi n xi x = xi2 i =1 n i =1

LadistribucinconjuntadeXeYtieneunadistribucin normalbivariante. ParacadavalordeX,hayunasubpoblacin devaloresY normalmentedistribuida. Lassubpoblaciones deXeYtienenlastodaslasmismas variancias. Lasmediasdelassubpoblaciones devaloresXeYse encuentrantodasenlamismalnearecta.

s yy =
i =1

n yi 2 n yi y = yi2 i =1 n i =1

05/09/2007

r=

s xy s xx s yy

r2 =0

C it i cuantitativo Criterio tit ti :


1) CorrelacinPerfecta(r=
CorrelacinImperfecta(0<r<1;1<r<0) CorrelacinNula(r=0)
X

+
x x

Criteriocualitativo:positivo

Criteriocualitativo:negativo

Pruebadehiptesis
ValoresdeZ

=0 Ho: 0 Ha:

RechazalaHosi:z<z

Z=
r 0.0 01 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9

z>z
n 3 1+ r . ln 1 r 2
Z= 1 1+ r ln 2 1 r

1 1+ r ln 2 1 r

0.000.010.020.030.040.050.060.070.080.09 0.0000.0100.0200.0300.0400.0500.060... 0 100 0.100 0.203 0.310 0.424 0.5490.5630.576

z = n 3.Z =
Donde: ZeslatransformacindeFisher

05/09/2007

Coeficientesdecorrelacin
16

Anlisisderegresin

CoeficientedePearson (rxy):apartirdedatosdiscretosy/ocontinuas. CoeficientedeSpearman (rs) :apartirdedosvariablesordinales,o muestraspequeasdevariablescontinuas. Coeficiente C fi i Biseral Bi lpuntual l( (rbp):apartir i d deunavariable i bl continua i y otradicotmica. CoeficienteBiseral (rb): apartirdeunavariablecontinuayotra dicotomizada. Coeficientecuadruple (r): apartirdedosvariablesdicotmicas. Coeficientetetracorico (rt) :apartirdedosvariablesdicotomizadas.

Variabledep pendiente(y)

14 12 10 8 6 4 2 0 1 2 3 4 5 6 7 8 9 10

y = + .x
y=a+b.x
a intercepto b pendiente

Variableindependiente(x)

= b0 + b1 x y

16

y
Valoresdey

16 14

14 12

12

i ei = yi y

10 8 6 b0+b1xi 4 2 0 yi ei

Valor res dey

10

ei

i ei = yi y
yi

e
i =1
9 10

b0+b1xi

2 0

e
i =1
9 10

e
i =1 n i =1

Valoresdex

= b0 + b1 x y

y (b
i

+ b1 xi )

Valoresde x

Comolosvaloresdeyi sonconocidosexperimentalmente, enelmtododemnimoscuadradoslosresiduosdependende losvaloresqueescogemosparab0 yb1 y quelasumatoria seamnimo,porlotantoesnecesarioquesusderivadasen relacinab0 yb1 seanulen:
2 ei 2 ei

e = [ y b
2 i =1
i

i =1

b1 xi ]

Derivandolaecuacinconrespectoab0 yb1 eigualandoacero

b0

=0

b1

=0

2 ei

b0

n 2 [ yi b0 b1 xi ] =0 = i =1 b0

Paratomarlavariacinmsgeneral,vamosarepresentarla Variableindependiente,queenestecasosearepresentadoporx

2 ei

b1

n 2 [ yi b0 b1 xi ] i =1 =0 = b1

05/09/2007

2 ei

b0

n 2 [ yi b0 b1 xi ] i =1 =0 = b0

2 ei

n = 2 ( yi b0 b1 xi ) ( yi b0 b1 xi ) = 0 b0 i =1

b1

n 2 [ yi b0 b1 xi ] i =1 =0 = b1

= 2 ( yi b0 b1 xi ) = 0
i =1

n = 2 ( yi b0 b1 xi ) ( yi b0 b1 xi ) = 0 b1 i =1

= 2 xi ( yi b0 b1 xi ) = 0
i =1

= ( yi b0 b1 xi ) = 0
i =1 n

= xi ( yi b0 b1 xi ) = 0
i =1 n

= yi nb0 b1 xi = 0
i =1 i =1 n n

= xi yi b0 xi b1 xi2 = 0
i =1 i =1 i =1

y
i =1

= nb0 + b1 xi .........................................(1)
i =1

x y
i =1 i

= b0 xi + b1 xi2 .........................................(2)
i =1 i =1

Elsistemadeecuacionesformadosonllamadosecuaciones normales(ec.1y2)

Reemplazandob0 enlaec.2

yi = nb0 + b1 xi .........................................(1)
i =1 i =1

x y
i =1 i

= b0 xi + b1 xi2
i =1 i =1

x y
i =1 i

= b0 xi + b1 xi2 .................................(2)
i =1 i =1

x y
i =1 i

n n 1 yi b1 x1 xi + b1 xi2 n i =1 i =1

=
Despejandob0 tenemos:

nb0 = yi b1 xi 1 b0 = yi b1 xi n b0 = y b1 x

1 n 1 yi xi n b1 ( xi ) + b1 xi2 n i =1

Despejandob1

b1 =

x y 1n x y x 1 ( x) n
i i i 2 i 2 i

.........

b1 =

S xy S xx

f(y) y

a = y b.x

b=

s xy s xx

Coeficientesdelasecuaciones

x1 x2 x3 xn

s e2 =

s yy (s xy ) / s xx
2

n2 1 x + n s xx
2

Sumadecuadradosdelerror

a t .s e
2

b t .s e
2

1 s xx

y = + .x

Limitesdeconfianzaparacoeficientesderegresin

05/09/2007

EstadsticoparaprobarlaHo: = 0

Regresinnolineal
Nosiemprelavariabledependienteeindependientetiene unarelacinlineal,existenotrasrelacionesquenose ajustanaunalnearecta.

t=

a se

ns xx

s xx + n x

()

t=

b se

s xx

Ejm. Ejm Funcinpolinomial Funcinlogartmica Funcinexponencial Funcinreciproca Funcinpotencial

Son valores de variables aleatorias que tienen distribucin t con n - 2 grados de libertad.

Regresinexponencial
y
5.0 4.5 4.0
Lo og.y

Regresinpolinomial

3.5 3.0 2.5 2.0 0 10 20 30 40 50 x

log y = log + x. log

y = 0 + 1 x + 2 x 2 + ........ + p x p

Modelo es adecuado

Las varianzas no son iguales

residuos

residu uos

X X Los residuos estn alrededor de 0 en forma aleatoria. La varianza es mayor para valores grandes de X.

05/09/2007

Modelo no es adecuado

0
residuo os

Existe una relacin entre los residuos y la variable

You might also like