Professional Documents
Culture Documents
Correlacinyregresin
A menudo es interesante estudiar la relacin entre dos variables de una poblacin o muestra.
= 0.05 = 0.01
Acepto la Ho
Anlisis de correlacin, mide la intensidad o fuerza de las relaciones, o sea el grado de asociacin de las variables. variables Anlisis de regresin, mide la naturaleza de la relaciones entre las variables.
y = + .x + = a + bxi y
Cuando el estudio se limita a dos variables, se denomina anlisis de correlacin simple y anlisis de regresin simple.
2 =
2 2 2 2 2
Factor2
2 2 = 2 2 2
2
r=
s xy s xx s yy
sxy =
Factor1
i =1
n n xi yi xi x yi y = xi yi i =1 i =1 n i =1
)(
r=
s xy sxx s yy
Suposicionesquefundamentanelmodelode Correlacin
2
s xx =
i =1
n 2 xi n xi x = xi2 i =1 n i =1
LadistribucinconjuntadeXeYtieneunadistribucin normalbivariante. ParacadavalordeX,hayunasubpoblacin devaloresY normalmentedistribuida. Lassubpoblaciones deXeYtienenlastodaslasmismas variancias. Lasmediasdelassubpoblaciones devaloresXeYse encuentrantodasenlamismalnearecta.
s yy =
i =1
n yi 2 n yi y = yi2 i =1 n i =1
05/09/2007
r=
s xy s xx s yy
r2 =0
+
x x
Criteriocualitativo:positivo
Criteriocualitativo:negativo
Pruebadehiptesis
ValoresdeZ
=0 Ho: 0 Ha:
RechazalaHosi:z<z
Z=
r 0.0 01 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
z>z
n 3 1+ r . ln 1 r 2
Z= 1 1+ r ln 2 1 r
1 1+ r ln 2 1 r
z = n 3.Z =
Donde: ZeslatransformacindeFisher
05/09/2007
Coeficientesdecorrelacin
16
Anlisisderegresin
CoeficientedePearson (rxy):apartirdedatosdiscretosy/ocontinuas. CoeficientedeSpearman (rs) :apartirdedosvariablesordinales,o muestraspequeasdevariablescontinuas. Coeficiente C fi i Biseral Bi lpuntual l( (rbp):apartir i d deunavariable i bl continua i y otradicotmica. CoeficienteBiseral (rb): apartirdeunavariablecontinuayotra dicotomizada. Coeficientecuadruple (r): apartirdedosvariablesdicotmicas. Coeficientetetracorico (rt) :apartirdedosvariablesdicotomizadas.
Variabledep pendiente(y)
14 12 10 8 6 4 2 0 1 2 3 4 5 6 7 8 9 10
y = + .x
y=a+b.x
a intercepto b pendiente
Variableindependiente(x)
= b0 + b1 x y
16
y
Valoresdey
16 14
14 12
12
i ei = yi y
10 8 6 b0+b1xi 4 2 0 yi ei
10
ei
i ei = yi y
yi
e
i =1
9 10
b0+b1xi
2 0
e
i =1
9 10
e
i =1 n i =1
Valoresdex
= b0 + b1 x y
y (b
i
+ b1 xi )
Valoresde x
Comolosvaloresdeyi sonconocidosexperimentalmente, enelmtododemnimoscuadradoslosresiduosdependende losvaloresqueescogemosparab0 yb1 y quelasumatoria seamnimo,porlotantoesnecesarioquesusderivadasen relacinab0 yb1 seanulen:
2 ei 2 ei
e = [ y b
2 i =1
i
i =1
b1 xi ]
b0
=0
b1
=0
2 ei
b0
n 2 [ yi b0 b1 xi ] =0 = i =1 b0
Paratomarlavariacinmsgeneral,vamosarepresentarla Variableindependiente,queenestecasosearepresentadoporx
2 ei
b1
n 2 [ yi b0 b1 xi ] i =1 =0 = b1
05/09/2007
2 ei
b0
n 2 [ yi b0 b1 xi ] i =1 =0 = b0
2 ei
n = 2 ( yi b0 b1 xi ) ( yi b0 b1 xi ) = 0 b0 i =1
b1
n 2 [ yi b0 b1 xi ] i =1 =0 = b1
= 2 ( yi b0 b1 xi ) = 0
i =1
n = 2 ( yi b0 b1 xi ) ( yi b0 b1 xi ) = 0 b1 i =1
= 2 xi ( yi b0 b1 xi ) = 0
i =1
= ( yi b0 b1 xi ) = 0
i =1 n
= xi ( yi b0 b1 xi ) = 0
i =1 n
= yi nb0 b1 xi = 0
i =1 i =1 n n
= xi yi b0 xi b1 xi2 = 0
i =1 i =1 i =1
y
i =1
= nb0 + b1 xi .........................................(1)
i =1
x y
i =1 i
= b0 xi + b1 xi2 .........................................(2)
i =1 i =1
Elsistemadeecuacionesformadosonllamadosecuaciones normales(ec.1y2)
Reemplazandob0 enlaec.2
yi = nb0 + b1 xi .........................................(1)
i =1 i =1
x y
i =1 i
= b0 xi + b1 xi2
i =1 i =1
x y
i =1 i
= b0 xi + b1 xi2 .................................(2)
i =1 i =1
x y
i =1 i
n n 1 yi b1 x1 xi + b1 xi2 n i =1 i =1
=
Despejandob0 tenemos:
nb0 = yi b1 xi 1 b0 = yi b1 xi n b0 = y b1 x
1 n 1 yi xi n b1 ( xi ) + b1 xi2 n i =1
Despejandob1
b1 =
x y 1n x y x 1 ( x) n
i i i 2 i 2 i
.........
b1 =
S xy S xx
f(y) y
a = y b.x
b=
s xy s xx
Coeficientesdelasecuaciones
x1 x2 x3 xn
s e2 =
s yy (s xy ) / s xx
2
n2 1 x + n s xx
2
Sumadecuadradosdelerror
a t .s e
2
b t .s e
2
1 s xx
y = + .x
Limitesdeconfianzaparacoeficientesderegresin
05/09/2007
EstadsticoparaprobarlaHo: = 0
Regresinnolineal
Nosiemprelavariabledependienteeindependientetiene unarelacinlineal,existenotrasrelacionesquenose ajustanaunalnearecta.
t=
a se
ns xx
s xx + n x
()
t=
b se
s xx
Son valores de variables aleatorias que tienen distribucin t con n - 2 grados de libertad.
Regresinexponencial
y
5.0 4.5 4.0
Lo og.y
Regresinpolinomial
y = 0 + 1 x + 2 x 2 + ........ + p x p
Modelo es adecuado
residuos
residu uos
X X Los residuos estn alrededor de 0 en forma aleatoria. La varianza es mayor para valores grandes de X.
05/09/2007
Modelo no es adecuado
0
residuo os