You are on page 1of 8

Ejemplo prctico de uso de ACP Me tom la libertad de sacar estadsticas de algunas comunas de Santiago, relacionadas principalmente con los

ingresos y la educacin (ao 1998), para hacer este e emplo! Comuna "onchal *ro+idencia -as "ondes .uoa -a /eina Macul *ealoln -a 0lorida San 1oa2un -a 3ran a -a *intana San /amn San Miguel -a "isterna 4st% "entral Maip5 6ta% 7ormal -o *rado *udahuel "erro 7a+ia /enca Habitantes #8$%$1& 89%#(, #,)%#() 1'1%,&( 91%#1$ 1($%($, 1')%(&$ #$9%1,$ 1(,%$,# 1(#%)18 1,,%&(8 1(1%(8& 181%$,8 #)8%),$ 1,%$8) #$)%1,$ 9(%8#, 11$%9)( 1#(%(,$ 1))%,(8 1)1%&#( Tasa de Aos de alfabetismo escolaridad adultos 98,' 9,(& 99,, 1#,') 99,# 1#,1) 99,# 1(,'# 98,, 1(,&1 98,8 1$,8) 9#,& ',,# 9& 9,(# 9&,9 9,() 9),) ',91 9&,& ',81 91,) ',( 99,) 1$,&9 9&,& 8,(& 9),8 9,$& 99,) 1$,), 98,# 8,91 9&,& 8,', 9),) ','9 9#,1 ',#, 9',# 9,$1 (fuente$ P%&'# Tasa de matrcula '1,( 81,8 8(,# 8(,' '8,( ',,, &),& && '1,( &),, &(,9 &',, '(,, &,,9 '(,& '#,, '#,) '$,8 &),9 &),' &9 Ingreso Per-Cpita (pesos !!"# '#%9)$ #'(%#9, (91%)'# ($&%'11 ($1%&&& 11(%&,( ,)%,,1 8&%$19 )8%#$) ,9%$)& ,#%9#& )1%$89 8&%##) )&%1'$ &$%81' 9,%$&1 &&%)$) &(%$#9 )(%&8# ,8%($( ))%#'#

4l ob eti+o es caracteri8ar e identi9icar a las comunas de acuerdo a un con unto de ndices 2ue e:pli2ue la mayor parte de la +ariabilidad de los datos% ;simismo, interesa descubrir las relaciones entre las +ariables originales y el agrupamiento de las comunas% 4n este e emplo slo se tomaron (( comunas dentro de las m<s representati+as de Santiago% =e9inamos las +ariables! (abit! >abitantes alfab)adult! ?asa de al9abetismo aos)esc! ;os de escolaridad

tasa)matric! ?asa de matrcula

ipercap !!"! @ngreso *erA"<pita

4l primer paso consiste en obtener las estadsticas b<sicas para cada +ariable, es decir, medias y des+iaciones! Media =es+% 4st<ndar habit 1'&$&',#81 989,,,))' al9abBadult 9&,9&( (,(1& aosBesc 9,)9& 1,9&' tasaBmatric '1,#$$ ),8)$ ipercap1998 1$#)&9,8)' 8'1($,#1# ; continuacin estandari8amos los datos (restar media y di+idir por de+iacin est<ndar), lo 2ue nos da! comuna "onchal *ro+idencia -as "ondes .uoa -a /eina Macul *ealoln -a 0lorida San 1oa2un -a 3ran a -a *intana San /amn San Miguel -a "isterna 4st% "entral Maip5 6ta% 7ormal -o *rado *udahuel "erro 7a+ia /enca (abit alfab)adult (,$& $,'8, A$,8'' 1,1$$ 1,'11 1,$)) A$,$,' 1,$)) A$,8)' $,&,9 A$,)&) $,8(9 A$,$$8 A1,)1' 1,#,) A$,,#, A$,)(& A$,$(8 A$,)#1 A$,&&$ A$,#18 A$,1&# A$,)), A(,,&) $,$)$ 1,1,) 1,8,, A$,1&# A1,&#' A$,)(, 1,#$, 1,1,) A$,8,1 $,&$, A$,&)8 A$,1&# A$,,,# A$,&&$ A$,($9 A1,',# A$,(,' $,1)# aos)esc A$,1'1 (,11( 1,8$' 1,)9# 1,)#( $,&#' A1,1$1 A$,18& A$,1'& A$,8)' A$,9$8 A1,(18 $,))& A$,&'9 A$,('# $,,8$ A$,#,9 A$,,#) A$,918 A1,1,' A$,(98 tasa)matric A$,$1' 1,'9) 1,88$ 1,9,9 1,1'9 $,)#$ A$,9', A$,9$& A$,$1' A1,$$8 A1,,#& A$,&&' $,188 A1,$9, $,((( $,#)9 $,#'& A$,$8) A$,9(# A$,9)' A$,#9# ipercap !!" A$,#,$ #,$8& (,1)8 1,18, 1,1(& $,1$, A$,&&' A$,($1 A$,)($ A$,&(& A$,&8) A$,&$( A$,198 A$,),, A$,,91 A$,1$9 A$,,() A$,,'' A$,)8, A$,&#& A$,))#

;cto seguido obtenemos la matri8 de correlaciones /, 2ue es el resultado de multiplicar la 5ltima matri8 obtenida, traspuesta, por ella misma (CtC) y di+idir por el n5mero de obser+aciones, lo 2ue nos da! habit al9abBadult aosBesc tasaBmatric ipercap1998 habit 1,$$$ $,(#, $,$', A$,$)( $,$,) al9abBadult aosBesc tasaBmatric ipercap1998 $,(#, $,$', A$,$)( $,$,) 1,$$$ *+,!*+,*. *+/0. 1,$$$ *+,!*+!.. *+!*0 1,$$$ *+,*. *+!.. *+"1" 1,$$$ *+/0. *+!*0 *+"1"

Se puede obser+ar 2ue en negrita est<n las correlaciones m<s signi9icati+as, lo 2ue en cierto modo es esperable, por e emplo en el caso de las +ariables al9abeti8acin, aos de escolaridad y tasa de matrculas, unto con el ingreso *erA"<pita las correlaciones esperadas son altas%

4l paso siguiente es resol+er el sistema! /u D lu y obtener los +alores y +ectores propios asociados! E1 #,#9) &',9$( &',9$( E( 1,$)9 (1,1'1 "!+*,1 E# $,,1$ 8,199 9',('# E, $,11$ (,19) 99,,&' E) $,$(' $,)## 1$$,$$$

Falor propio G +arian8a de cada componente G acumulado Fectores propios! E1 $,$)9 $,,)$ $,)#' $,)1, $,,9(

habit al9abBadult aosBesc tasaBmatric ipercap1998

E( $,9)1 $,(#1 A$,$#' A$,1'( A$,1$)

E# A$,(&# $,'') A$,$,' A$,$), A$,)'$

E, $,1)1 A$,(8$ A$,$&1 $,'9$ A$,)($

E) $,$$$ A$,()) $,8#9 A$,(8( A$,#89

=ebe notarse 2ue como usamos la matri8 de correlaciones, la suma de los +alores propios debe ser igual a%%%%) (el n5mero de +ariables), 2ue es igual a la suma de las +arian8as de la matri8 de correlaciones (solo unos en la diagonal)% 7otemos 2ue la +arian8a aportada por los dos primeros +alores propios acumula el 89,$',G de toda la +arian8a de los datos, por lo 2ue nos 2uedaremos con los dos primeros +ectores propios para construir nuestras componentes principales% ;ntes de hacer interpretaciones, debemos anali8ar las nue+as +ariables creadas a tra+s del crculo de correlaciones, el cual se contruye usando las 9rmulas +istas en clase% *or e emplo, para la +ariable (abit! r habit ,U 1 = uhabit ,1 l1 s habit uhabit ,( l( s habit = $, $)9 #, #9) = $,1$8 1 $,9)1 1, $)9 = $, 9'8 1

r habit ,U ( =

@M*H/?;7?4! "omo estamos traba ando con la matri8 de correlaciones, y las obser+aciones est<n estandari8adas, las +arian8as de las +ariables estndari8adas son 1% ;simismo, podemos escribir las correlaciones de cada una de las +ariables estandari8adas y construir el crculo de correlaciones!

Variables (Ejes F1 y F2: 89 % )


1,5

habit

-- Eje U2 (21 %) -->

0,5 alfab_adult 0 aos_esc ipercap1998 tasa_matric

-0,5

-1

-1,5 -1,5

-1

-0,5

0,5

1,5

-- Eje U1 (68 %) -->

4l crculo de correlaciones es clari9icador, en e9ecto, las +ariables matrcula,ingreso, escolaridad y al9abeti8acin se encuentran muy concentradas en el primer e e, al cual podemos denominar Ini+el educati+oJ o Icapacidad de educacinJ, mientras 2ue el segundo e e 2ueda casi completamente e:plicado por la cantidad de personas 2ue +i+en en una comuna y un poco por el ni+el de al9abeti8acin% ; este e e le podramos denominar Ipoblacin escolari8adaJ1% KSe acuerdan de las altas correlaciones mostradas por las +ariables originales al principioL% Mueno, esto 2ueda rati9icado por la pro:imidad 2ue muestran unas con otras en el gr<9ico anterior% K6u pasa con las obser+acionesL

1 4sta es 2ui8< la parte m<s sub eti+a del an<lisis, ya 2ue depende de como uno interprete la relacin y agrupamiento de las +ariables%

*ara anali8arlas, debemos construir las componentes principales para cada obser+acin% *or e emplo, para "onchal, las primera componente principales es!

Cconchali ,1 = U1t Rconchali


=onde E1 es el primer e e principal, y /conchali es el +ector 2ue contiene los +alores de las +ariables para "onchal en la matri8 estandari8ada, esto es! "conchali,1 D $,$)9N(,$&1O$,,)N$,'8,O$,)#'N(A$,1'1)O$,)1,N(A$,$1')O$,,9(N(A$,#,) D $,($& ;simismo, su segunda componente principal es! "conchali,( D $,9)1N(,$&1O$,(#1N$,'8,O(A$,$#')N(A$,1'1)O(A$,1'()N(A$,$1')O(A$,1$))N(A$,#,) D (,18' -uego el +ector de componentes principales para "onchal es! $, ($& Cconchali = (,18'

>abiendo calculado las componentes principales para cada obser+acin, podemos hacer un gr<9ico con los dos e es!

Observaciones (Ejes U1 y U2: 89 %)


2,5 2 1,5 1 0,5 'an $i(uel 0 -0,5 -1 -1,5 -2 -3 -2 -1 0 1 2 3 4 5 -- Eje U1 (68 %) --> !a intana Renca ealol0n udahuel Cerro Navia !a *ran+a 'an ,oa-u.n $acul !o rado "ta# Normal 'an Ram)n 1uoa Conchal. !a Cisterna $aip% !as Condes

!a /lorida

-- Eje U2 (21 %) -->

!a Reina rovidencia

&st# Central

>abiendo reali8ado la identi9icacin de la componentes, podemos distinguir 2ue las comunas con mayor acceso o capacidad de educacin son principalmente las comunas del Marrio ;lto o de me ores ingresos (-as "ondes, *ro+idencia, -a /eina, .uoa) lo cual es intuiti+amente esperable% -o 2ue las di9erencia, sin embargo, es la cantidad de poblacin escolari8ada presente en ellas, siendo la m<s alta la comuna de -as "ondes, seguida por .uoa (pero de le os)% 4n el otro lado del primer e e se encuentran las comunas m<s pobres y con menos acceso a educacin! San /amn, "erro 7a+ia, -a *intana y *ealoln% 4n general, las comunas m<s pobres se caracteri8an por tener un ba o ni+el de ingresos y un ba o ni+el de escolaridad entre los adultos% 4l gr<9ico casi habla por si solo una +e8 2ue se ha comprendido el signi9icado de cada e e% ;dicionalmente, podemos anali8ar las correlaciones al cuadrado para estudiar el a uste de cada +ariable respecto de la construccin de cada e e% =e hecho, la distancia de cada +ariable al origen del crculo representa la bondad del a uste de la +ariable en el plano con9ormado por las componentes principales,

es decir, es un coe9iciente de determinacin, o sea un smil a /(% "uadrados de las correlaciones! E1 $,$1( $,&8' $,9'9 $,89' $,8(1 E( $,9)' $,$)' $,$$1 $,$#1 $,$1( E# $,$(8 $,(,& $,$$1 $,$$1 $,1## E, $,$$# $,$$9 $,$$$ $,$&8 $,$#$ E) $,$$$ $,$$( $,$19 $,$$( $,$$,

habit al9abBadult aosBesc tasaBmatric ipercap1998

"ontribucin de cada +ariable al 9actor (G)! E1 $,#,) ($,((& (8,8(1 (&,,1' (,,19( E( 9$,,,, ),#)# $,1#) (,9&# 1,1$& E# &,9(# &$,$'9 $,((1 $,(88 #(,,89 E, (,(89 ',8&, $,#'1 &(,#8, (',$9 E) $,$$$ &,,'' '$,,)# ',9,9 1),1(1

habit al9abBadult aosBesc tasaBmatric ipercap1998

K6u sucede si introducimos una nue+a comuna, como por e emplo, *uente ;ltoL -os +alores de *uente ;lto son! habit #8&)#& al9abBadult 98 aosBesc 1$,18 tasaBmatric '#,& ipercap1998 9,$'8

-as 2ue estandari8adas dan! habit (,1# al9abBadult $,,' aosBesc $,# tasaBmatric $,#9 ipercap1998 A$,11

-as componentes principales asociadas son! "pte%;lto,1 D $,1() "pte%;lto,( D (,$(#

-o 2ue ubica a *te% ;lto en el gr<9ico de los e es cerca de "onchal y Maip5!

Observaciones (Ejes U1 y U2: 89 %)


2,5 2 1,5 1 0,5 'an $i(uel 0 -0,5 -1 -1,5 -2 -3 -2 -1 0 1 2 3 4 5 -- Eje U1 (68 %) --> !a intana Renca ealol0n udahuel Cerro Navia !a *ran+a 'an ,oa-u.n $acul !o rado "ta# Normal 'an Ram)n 1uoa Conchal. !a Cisterna
te# 5lto

!a /lorida

$aip% !as Condes

-- Eje U2 (21 %) -->

!a Reina rovidencia

&st# Central

Se puede obser+ar con esto 2ue el ;"* puede ser 5til, adem<s, como herramienta de clasi9icacin% 4so es todo% Suerte% /odrigo ;bt M%

(&P11P$#

You might also like