Professional Documents
Culture Documents
Estadstica descriptiva
bivariante y regresin lineal.
Estadstica bivariante
Regresin a la media
Conclusin: los padres muy altos tienen tendencia a tener hijos que
heredan parte de esta altura, aunque tienen tendencia a acercarse
(regresar) a la media. Lo mismo puede decirse de los padres muy
bajos.
Francis Galton
Primo de Darwin
Estadstico y aventurero
Fundador (con otros) de
la estadstica moderna
para explicar las teoras
de Darwin.
Qu vamos a estudiar
Bioestadstica.
Altura
en cm.
Peso
en Kg.
162
61
154
60
180
78
158
62
171
66
169
60
166
54
176
84
163
68
...
...
Bioestadstica.
Pesa 50 kg.
Mide 161 cm.
Bioestadstica.
Pesa 76 kg.
ue
q
ce
e
r
Pa
Bioestadstica.
s
e
p
el
nta
e
um
a
o
la
n
co
a
r
u
t
al
10 kg.
10 cm.
Bioestadstica.
Incorrelacin
280
230
180
130
80
30
140
150
160
170
180
190
200
Bioestadstica.
380
320
340
360
400
420
r= 0.415
r^2 = 0.172
150
160
170
180
La distribucin de Y,
independientemente del valor de X, se
denomina distribucin marginal.
190
370
380
390
r= 0.984
r^2 = 0.969
360
350
150
160
Bioestadstica.
170
180
190
Si la dispersin se reduce
notablemente, el modelo de regresin
ser adecuado.
Tema: Estadstica bivariante
Incorreladas: Sxy =0
1
S xy ( xi x )( yi y )
n i
Bioestadstica.
10
Bioestadstica.
S xy
SxS y
11
Propiedades de r
Es adimensional
Slo toma valores en [-1,1]
Las variables son incorreladas r=0
Relacin lineal perfecta entre dos variables r=+1 o r=-1
-1
Bioestadstica.
Variables
incorreladas
Relacin
directa
casi
perfecta
+1
Tema: Estadstica bivariante
12
Bioestadstica.
13
Bioestadstica.
14
Bioestadstica.
15
Preguntas frecuentes
Bioestadstica.
16
17
Regresin
= Variable dependiente
predicha
explicada
= Variable independiente
predictora
explicativa
Es
Y = f(X) + error
Bioestadstica.
18
Regresin
Bioestadstica.
19
= b0 + b1X
b0 (ordenada en el origen, constante)
b1 (pendiente de la recta)
Bioestadstica.
20
= b0 + b 1 X
b1=0,5
b0=85 cm
Bioestadstica.
21
b1=0,5
b0=85 cm
Bioestadstica.
22
i ei2
SY
b1 r
SX
b0 y b1 x
Bioestadstica.
23
Bioestadstica.
24
Cometi un error
de -30 en su
ltima prediccin
Bioestadstica.
25
Bioestadstica.
26
Interpretacin de la variabilidad en Y
En primer lugar olvidemos que existe la
variable X. Veamos cul es la variabilidad
en el eje Y.
Bioestadstica.
27
Bioestadstica.
28
Bondad de un ajuste
Resumiendo:
S
R 1
S
2
Bioestadstica.
S e2 SY2
2
e
2
Y
Tema: Estadstica bivariante
29
Bioestadstica.
30
por qu?
por qu?
Bioestadstica.
31
Bioestadstica.
32
1 variable explicativa
Modelos de regresin
Simple
Lineal
2+ variables explicativas
Mltiple
No lineal
Lineal
No lineal
Bioestadstica.
33
12
14
10
12
8
10
8
6
4
4
Desv. tp. = 8,64
Media = 173,3
N = 59,00
0
155,0
165,0
160,0
175,0
170,0
Bioestadstica.
185,0
180,0
195,0
190,0
Media = 170,8
N = 59,00
0
160,0
165,0
162,5
170,0
167,5
175,0
172,5
180,0
177,5
182,5
34
180
170
b0=89,985
b1=0,466
Aprecias regresin a la media?
160
170
180
190
200
Eso significa que el 57% de las predicciones del modelo son correctas?
Cmo lo interpretas?
Coeficientesa
Correlaciones
Correlacin de Pearson
Altura del
Padre
,759
1,000
150
150
160
R
,759a
R cuadrado
,577
R cuadrado
corregida
,569
Coeficientes no
estandarizados
Modelo
1
(Constante)
Altura del Padre
B
89,985
,466
Error tp.
9,180
,053
Error tp. de la
estimacin
3,480
35
Qu hemos visto?
Ordenada en el origen
Pendiente
Residuo, error
Bondad del ajuste, coef. determinacin
Bioestadstica.
36