Professional Documents
Culture Documents
principales
Correlación
• Examina el grado en que 2 variables
varían a la par.
• Por ejemplo, ¿existe una variación a la par
entre el largo de la nariz (x) y el largo de la
oreja izquierda (y)?
• La hipótesis nula sería:
H0: x no se correlaciona con y
Correlación
Correlación
• r = coeficiente de correlación; provee una
medida de la dispersión de los valores
desde la línea de mejor correlación
• y = a + bx; define la línea de mejor
correlación
• a = intercepto en y
• b = pendiente de la línea de correlación
Cuando tratamos con más de
2 variables
ancho
largo
Primer componente resume ambas variables:
a2 1 a2 1
COMPONENTES PRINCIPALES 23
Componentes principales
...
ai 1 ai 1
COMPONENTES PRINCIPALES 24
Componentes principales muestrales
Teorema
Sea la matriz de datos X nxp y los pares de autovalores
y autovectores de Sn
(ˆ 1, eˆ1 ), , (ˆ p, eˆ p ) con ˆ 1 ˆ p 0.
Entonces la i-ésima componente principal muestral
es: Yˆi eˆi ' X eˆi1 X 1 eˆip X p .
La varianza muestral de Yˆ es ˆ .i i
Ejemplo
COMPONENTES PRINCIPALES 26
Componentes principales muestrales
Autovalores y autovectores
COMPONENTES PRINCIPALES 27
Componentes principales muestrales
i
n.
1 2 i n nº c.p.
COMPONENTES PRINCIPALES 28
Componentes principales con la matriz de correlaciones
29