You are on page 1of 6

Ejemplo Regresin

Bioestadstica 1 C 2014

Ejemplo con los datos del Ejercicio 8.4


Solucin
Concentracin X(en mg/ml)
Lectura Y

1
20
19

2
20
21

3
30
24

4
30
27

5
30
27

6
40
29

7
40
31

8
60
35

9
60
36

10
60
37

a) Hacer el diagrama de dispersin.


b) Ajustar la recta de mnimos cuadrados.
c) Se puede afirmar, con un nivel de significacin del 5 %, que la regresin es
significativa?
d) Hallar el intervalo de confianza del 95 % para la lectura promedio
correspondiente una concentracin de 35 g/ml.
e) Hallar el intervalo de confianza del 95 % para el parmetro de la recta de
regresin.
f) Hallar el intervalo de prediccin del 95 % para la lectura correspondiente una
concentracin de 35 g/ml.

Ejemplo Regresin

Bioestadstica 1 C 2014

Resolucin
a) Yij : lectura de la j-sima muestra correspondiente a la concentracin Xi
i=1, ,4, j=1,ni

En el grafico se observa que, la Lectura(Y) cambia linealmente con la


Concentracin(X), es razonable, entonces proponer un modelo lineal del tipo

E Y X
b)

X


Y

S
866
XY
0.3781
y.. x = 286 0.3781 390 13.8515
SXX 2290
10
10
La recta de regresin obtenida con el mtodo de Mnimos Cuadrados es:

13.85 0.38 x
y

(2 decimales)

c) En TODO lo que sigue suponemos

Yij ~ N i , i v.a.independientes

12 22 2I var ianzas hom ogneas


Una forma de testear si 0 es mediante un test t para la pendiente de la recta de
regresin. En general plantearamos las hiptesis:
a) H0: 0
b) H0: 0

H1: > 0
H1: < 0
2

Ejemplo Regresin

c) H0: = 0

Bioestadstica 1 C 2014

H1: 0 (si 0=0 se llama Test significacin de la regresin)

En nuestro caso utilizamos el ltimo con 0=0, es decir


H0: = 0 (no hay regresin)

H1: 0 (hay regresin)

0
~ t n 2 si H es verdadera
0
CM RES
Sxx

Zona de rechazo | T| t n 2, / 2
Datos:
Syy=348.4
CMRES=

Sxx=2290
2
S XY
SYY
S XX

n 2

Tcalculado

Sxy=866, con lo cual


1
8662

2.6135

348.4
10 2
2290

0.3781 0
11.1921 2.306 t n 2 , 0.05 2 , R H0, la regresin es
2.6135
2290

significativamente distinta de 0. La lectura del aparato depende de la concentracin.


Otra forma: con un IC(95%) para .
H0: = 0 (no hay regresin)

H1: 0 (hay regresin)

IC t / 2, n 2 CM RES SXX ; t / 2, n 2 CM RES SXX

IC 0.38 2.306 2.6135 2290 ; 0.38 2.306 2.6135 2290

que result ser IC = [0.30;0.46], como 0 [0.30;0.46], R H0, nuevamente concluimos


que la regresin es significativamente distinta de 0.
Otra forma: con un test F
Este test F se basa en la descomposicin de la Suma de Cuadrados Total (SCT).
Yij Y.. (Yij Yi ) (Yi Y.. )

Elevamos al cuadrado y sumamos, el doble producto se anula y queda

(Y

ij

Y.. ) 2 (Yij Yi ) 2 (Yi Y.. ) 2 (descomposicin de la suma de

cuadrados)
SCT

SCRES

+ SCREG

(Resultado probado en terica).

Ejemplo Regresin

Bioestadstica 1 C 2014

Con esto se hace la tabla de Anlisis de la Varianza, que es lo que dan los paquetes
estadsticos y el Excel.

Ejemplo Regresin

Bioestadstica 1 C 2014

H0: = 0 (no hay regresin)


Fuente de
variacin
REGRESION
RESIDUOS
TOTAL

H1: 0 (hay regresin)

SC

gl

CM

SCREG
SCRES
SCT

1
n-2
n-1

CMREG
CMRES

CMREG/CMRES

F ~ F1,n-2 cuando H0 es verdadera


RH0 si F F1,n-2,
Datos:
SCT=Syy = 348.4

SCRES = CMRES*(n-2)=2.6135*8=20.9083

SCREG SCT SC RES 3484 20.9083 327.4917

Fuente de
variacin
REGRESION

SC

gl

CM

327.4917

327.4917

125.30593

RESIDUOS
TOTAL

20.9083
384.4

8
9

2.6135

Fcal=125.30593 > F1,8,0.05 = 5.32, con lo cual , al 5 % rechazo H0, y la regresin es


significativa, o sea 0.
Salida del Excel
ANLISIS DE VARIANZA
Grados de
libertad

Regresin
Residuos
Total

Intercepcin
Concentracin X(en
mg/ml)

Suma de
Promedio de los
Valor crtico
cuadrados
cuadrados
F
de F
1
327,491703
327,491703
125,305931 3,6351E-06
8
20,9082969
2,61353712
9
348,4
Coeficiente
Estadstico Probabilida
Inferior
Superior
s
Error tpico
t
d
95%
95%
13,8515284 1,41323902 9,80126377 9,8586E-06 10,5925934 17,1104634
0,37816594 0,03378287 11,1940132

3,6351E-06 0,30026249 0,45606939

d) Una aplicacin de la recta de regresin es que sirve para interpolar, en este caso
xk = 35 (xk pertenece al intervalo de validez del modelo, es decir en este caso
xk x min ; x max = 20;60 )
Y 35

= 13.85+0.38*35=27.15 g/ml estimacin puntual del valor esperado de la


lectura.

Ejemplo Regresin

Bioestadstica 1 C 2014

Intervalo de confianza para media de Y dado un valor de x

ICE Y Y x k t n 2,

1 xk x2

n
S
XX

CM RES

Ejemplo para los datos dados


1
(35 39) 2

27.15 1.2193=(25.93,28.37) g/ml


27
.
15

2
.
306
2
.
6135

ICE(Y)=
10
2290

e) Intervalo de confianza para de nivel 0.95


CM RES n i x i2
n SXX

IC
t n 2, / 2

IC 13.85 2.306

2.6135 * 17500
13.85 3.2589
10 * 2290

IC (10.59;17.11) g/ml

f) Intervalo de prediccin
x t
IPYk Y
k
n 2,

1 x x
CM RES 1 k
n
SXX

IPYk= 27.15 2.306 2.6135 1

1 (35 39) 2
27.15 2.8931=(24.26;30.04) g/ml

10
2290

Notar que: para la misma muestra y el mismo nivel el IC tiene menor longitud que el de
preedicin y adems IC IP, es decir el Intervalo de Confianza est contenido en el
Intervalo de Prediccin.

You might also like