Professional Documents
Culture Documents
OLEH:
Dalam Analisis Mutivariat terdapat banyak metode yang dapat digunakan untuk
menyelesaikan masalah atau mengolah data yang melibatkan banyak variabel. Misalnya
pada saat melakukan suatu penelitian, data yang diperoleh adalah rekapan data yang
berupa tabel nilai rata-rata dari beberapa peubah/variabel pada beberapa objek.
Semakin banyak peubah yang diukur dan semakin banyak objek yang diamati, maka
ukuran tabel yang dimiliki akan semakin besar dan semakin sulit untuk
menginterpretasikannya. Untuk itu diperlukan suatu metode yang mampu
mempermudah interpretasi dari data yang dimiliki. Metode Mutivariat yang dapat
digunakan untuk mengatasi masalah tersebut salah satunya adalah biplot.
Analisis Biplot diperkenalkan oleh Gabriel pada tahun 1971. Biplot adalah salah
satu upaya menggambarkan data -data yang ada pada tabel ringkasan dalam grafik
berdimensi dua. Analisis biplot bersifat deskriptif dengan dimensi dua yang dapat
menyajikan secara visual segugus objek dan variabel dalam satu grafik. Grafik yang
dihasilkan dari biplot ini merupakan grafik yang berbentuk bidang datar.
Biplot merupakan teknik statistika deskriptif yang dapat menyajikan secara
simultan n objek pengamatan terhadap p peubah dalam dua dimensi, sehingga ciri-ciri
peubah dan objek pengamatan serta posisi relatif antar objek pengamatan dengan
peubah dapat dianalisis (Jollife, 2002:90).
Pada analisis biplot, analisis data dilakukan terhadap matriks data yang terkoreksi
terhadap nilai tengahnya. Setelah data dipusatkan akan didapatkan matriks data yang
telah terkoreksi terhadap nilai tengahnya, yang dinotasikan dengan 𝑋̃ dan ditulis
sebagai:
𝑥̃11 𝑥̃12 … 𝑥̃1𝑝
𝑥̃ 𝑥̃
𝑋̃ = [ 21 22 … 𝑥̃2𝑝 ]
⋮ ⋮
𝑥̃𝑛1 𝑥̃𝑛2 .⋱. . ⋮
𝑥̃𝑛𝑝
̃
𝑥11 − 𝑥̅̃1 𝑥12 − 𝑥̅̃2 … 𝑥1𝑝 − 𝑥̅𝑝
̃ ̃
= 𝑥21 − 𝑥̅1 𝑥22 − 𝑥̅2 … 𝑥2𝑝 − 𝑥̅̃𝑝
⋮ ⋮ ⋱
… ⋮
𝑥
[ 𝑛1 − ̃
𝑥̅ 1 𝑥 ̃2
𝑛2 − 𝑥̅ 𝑥𝑛𝑝 − 𝑥̅̃𝑝 ]
Biplot dapat dibangun dari suatu matriks data, dengan masing-masing kolom mewakili
suatu variabel, dan masing-masing baris mewakili objek penelitian ( Udina:2005) .
Matrik x adalah matriks yang memuat variabel-variabel yang akan diteliti sebanyak
p dan objek penelitian sebanyak n. Nilai singularnya adalah nXp= nUr r Lr AT P ,dengan (r
≤ {n,p}).
U dan A adalah matriks dengan kolom ortonormal dan L adalah matriks diagonal
berukuran (r x r)dengan unsur-unsur diagonalnya adalah akar dari nilai eigen XT X
yaitu (√𝜆1 , ≥ √𝜆2 ≥ … … √𝜆𝑟 ) . dan kolom-kolom matriks A adalah vektor eigen dari XT X.
1
Kolom-kolom untuk matriks U diperoleh dari 𝑢𝑖 = 𝑎 dengan i=1,2,....r dengan ui
√𝜆𝑖 𝑖
adalah kolom matriks U, ai adalah kolom matrik A dan 𝜆𝑖 adalah nilai eigen ke-i.
𝑋 = 𝑈𝐿𝑎 𝐿1−𝑎 𝐴′ = 𝐺𝐻 ′
̃ p = n𝑼𝒓 𝑳𝒓 𝑨𝒑
nX
′
=n𝑮𝒓 𝑯′𝒑
dimana:
𝑮 = 𝑼, 𝑯 = 𝑨𝑳 , 𝛼 = 0
𝑨 = (𝒂𝟏 , 𝒂𝟐 , … , 𝒂𝒓 ), 𝑼 = (𝒖𝟏 , 𝒖𝟐 , … , 𝒖𝒓 )
̃ , maka di dapat matriks U sebagai
Dengan penguraian nilai singular matriks data 𝑿
berikut:
̃ 𝑨𝑳−𝟏
𝑼=𝑿
0 1 0
… 0 1
√𝜆 1
= [(𝑥1 − 𝑥̅ )′ , (𝑥2 − 𝑥̅ )′ , … , (𝑥𝑛 − 𝑥̅ )′ ][𝑎1 , 𝑎2 , … , 𝑎𝑟 ] 0 √𝜆2 … ⋮
⋱ 1
⋮ ⋮ …
[ 0 0 √𝜆 𝑟 ]
−1/2 ′ −1/2 ′
−1/2 ′
𝜆1 (𝑥1 − 𝑥
̅) 𝑎1 𝜆2 (𝑥1 − 𝑥
̅) 𝑎2
… 𝜆𝑟 (𝑥1 − 𝑥) 𝑎𝑟
̅
−1/2 ′ −1/2 ′ ′
𝑈 = 𝜆1 (𝑥2 − 𝑥
̅) 𝑎1 𝜆2 (𝑥2 − 𝑥 ̅) 𝑎2 … 𝜆−1/2
𝑟 (𝑥2 − 𝑥
̅) 𝑎𝑟
⋮ ⋮ ⋮
… ⋮
−1/2 ′ −1/2 ′ −1/2 ′
[ 𝜆1 (𝑥𝑛 − 𝑥
̅ ) 𝑎1 𝜆2 (𝑥𝑛 − 𝑥
̅ ) 𝑎2 𝜆𝑟 (𝑥𝑛 − 𝑥
̅) 𝑎𝑟 ]
𝜆1
1/2 0 … 0
𝑨𝑳 = [𝑎1 , 𝑎2 , … , 𝑎𝑟 ] 0
1/2
𝜆2 … 0
⋮ ⋮ ⋮
⋮ … 1/2
[ 0 0 𝜆𝑟 ]
Dan
1 1 1
𝑎11 𝜆21 𝑎12 𝜆22 𝑎1𝑟 𝜆2𝑟
1 1 … 1
𝑯= 𝑎21 𝜆21 𝑎22 𝜆22 … 𝑎2𝑟 𝜆2𝑟
⋱
… ⋮
⋮ ⋮
1 1 1
𝑎 𝜆2
[ 𝑝1 1 𝑎𝑝2 𝜆22 𝑎𝑝𝑟 𝜆2𝑟 ]
Dari pendekatan matriks X pada dimensi dua diperoleh matriks G dan H sebagai berikut :
Matriks G adalah titik-titik koordinat dari objek dan matriks H adalah titik-titik
koordinat dari p variable yang akan diplot sebagai titik koordinat.
(𝜆1 + 𝜆2 )
𝜌2 =
∑𝑟𝑘=1 𝜆𝑘
Dengan
𝑋̃ ′ 𝑋̃ = (𝐺𝐻 ′ )′ (𝐺𝐻 ′ )
= 𝐻𝐺 ′ 𝐺𝐻 ′
= 𝐻𝑈 ′ 𝑈𝐻 ′
= 𝐻𝐻 ′
𝐻𝐻 ′ = (𝑛 − 1)𝑆
Hasil kali ℎ𝑖 ℎ𝑗 adalah akan sama dengan (n-1) kali kovarian 𝑆𝑗𝑘 antara variabel
ke-j dan variabel ke-k. Selanjutnya untuk mengetahui variansi variabel gunakan
matriks H.
2 2
ℎ11 + ℎ12 … ℎ11 ℎ𝑝1 + ℎ12 ℎ𝑝2
=[ … … … ]
2 2
ℎ11 ℎ𝑝1 + ℎ12 ℎ𝑝2 … ℎ𝑝1 + ℎ𝑝2
2 2 2 2 2 2
Diagonal utama pada matriks 𝐻𝐻 ′ ∶ ℎ11 + ℎ12 , … . , ℎ𝑗1 + ℎ𝑗2 , … . ℎ𝑝1 + ℎ𝑝2
2 2
menggambarakan variansi dari variabel. Sedangkan ℎ𝑗1 + ℎ𝑗2 , j=1,2…n menyatakan
panjang vector variable (dengan jarak Euclid dari titik O (0,0). Sehingga dapat
disimpulkan bahwa panjang vector variable sebanding dengan variansi variable.
Nilai cosinus sudut antara dua vector peubah menggambarkan korelasi kedua
peubah. Semakin sempit sudut yang dibuat antara dua variable maka semakin tinggi
korelasinya. Korelasi peubah ke-j sama dengan nilai cosinus sudut vector ℎ𝑗 ℎ𝑘 .
Kedekatan antar obyek pada gambar biplot dapat dilihat dengan jarak Euclid
antara 𝑔𝑖 dan 𝑔𝑗 sebanding dengan jarak Mahalanobis antar objek pengamatan 𝑥𝑖 dan
𝑥𝑗 dalam data pengamatan sesungguhnya.
Menurut Jolife (1986) 𝛿 2 (𝑥𝑖 𝑥𝑗 ) = (𝑛 − 1)2 𝑑2 (𝑔𝑖 𝑔𝑗 ) . hal ini dapat dibuktikan
sebagai berikut. Persamaan yang ketiga diatas dapat ditulis kembali sebagai 𝑥𝑖′ =
𝑔𝑖 𝐻𝑖′ , 𝑖 = 1,2, … . , 𝑛 dan disubstitusikan ke dalam persamaan sehingga menghasilkan :
= (𝐻(𝑔𝑖 𝑔𝑗 )) 𝑆 −1 𝐻(𝑔𝑖 𝑔𝑗 )
= (𝑔𝑖 𝑔𝑗 ) 𝐻𝑆 −1 𝐻(𝑔𝑖 𝑔𝑗 )
𝑋 ′ 𝑋 = (𝑈𝐿𝐴′ )′ (𝑈𝐿𝐴)′
=𝐴𝐿𝑈 ′ 𝑈𝐿𝐴′
= 𝐴𝐿−2 𝐴
Dan
(𝑋 ′ 𝑋)-1=((𝑈𝐿𝐴′ )(𝑈𝐿𝐴))-1
= (𝑈 ′ 𝐿𝐴𝑈𝐿𝐴)-1
= (𝐴𝐿𝑈 ′ 𝑈𝐿𝐴)-1
= 𝐴𝐿−2 𝐴
′
= (𝑛 − 1)2(𝑔𝑖 𝑔𝑗 ) 𝐿(𝐴′ 𝐴)𝐿−2 𝐿(𝑔𝑖 𝑔𝑗 )
′
= (𝑛 − 1)2(𝑔𝑖 𝑔𝑗 ) 𝐿𝐿−2 𝐿(𝑔𝑖 𝑔𝑗 ), (A adalah orthogonal)
′
= (𝑛 − 1)2(𝑔𝑖 𝑔𝑗 ) (𝑔𝑖 𝑔𝑗 )
= (𝑛 − 1)2𝑑2 (𝑔𝑖 𝑔𝑗 )
Berarti dapat dilihat bahwa Mahaanobis sebanding dengan jarak Euclid. Hal ini
mennunjukkan bahwa jarak Euclid mampu menggambarkan posisi objek pengamatan
dalam data pengamatan sesungguhnya. Jika a=1 maka G=UL dan H=A sehingga
diperoleh :
𝑋𝑋" = (𝐺𝐻′)(𝐺𝐻′)′
= 𝐺𝐻′𝐻𝐺′
= 𝐺𝐴′ 𝐴𝐺 ′
= 𝐺𝐺 ′
Pada keadaan ini,jarak Euclid antara 𝑔𝑖 dan 𝑔𝑗 akan sama dengan jarak Euclid
antara objek pengamatan 𝑥𝑖 dan 𝑥𝑗 . Vector baris ke-i sama dengan skor komponen
utama untuk respon ke-I dari hasil analisis komponen utama. Untuk G=UL maka
unsure ke-k dari 𝑔𝑖 adalah 𝑢𝑖𝑘 √𝜆𝑘 . Hasil tersebut sama dengan 𝑍𝑖𝑘 yang merupakan
skor komponen utama ke-k ari objek ke-I. sedangkan H=A diperoleh bahwa vector
pengaruh kolom ℎ𝑗 sama dengan 𝑎𝑗 .
Tujuan dari analisis biplot adalah untuk menyajikan secara simultan n objek
pengamatan dan p variabel dalam ruang bidang datar sehingga ciri-ciri variabel dan
objek pengamatan serta posisi relatif antar objek pengamatan dapat dianalisis.
3. Manfaat Analisis
Tiga hal penting yang bisa didapatkan dari tampilan biplot adalah (Sartono dkk,
2003) :
1. Kedekatan antar objek yang diamati
Informasi ini dapat dijadikan panduan untuk mengetahui objek yang memiliki
kemiripan karakteristik dengan objek lain. Penafsiran ini mungkin akan berbeda
untuk setiap bidang terapan, namun inti dari penafsiran ini adalah bahwa dua objek
yang memiliki karakteristik sama akan digambarkan sebagai dua titik dengan
posisi yang berdekatan.
2. Keragaman peubah
Informasi ini digunakan untuk melihat apakah ada variabel yang mempunyai
nilai keragaman yang hampir sama untuk setiap objek. Dengan informasi ini, bisa
diperkirakan pada variabel mana strategi tertentu harus ditingkatkan, dan juga
sebaliknya. Dalam biplot, variabel yang mempunyai nilai keragaman yang kecil
digambarkan sebagai vektor pendek sedangkan variable dengan nilai keragaman
yang besar digambarkan sebagai vektor yang panjang.
3. Korelasi antar peubah
Dari informasi ini bisa diketahui bagaimana suatu variabel mempengaruhi
ataupun dipengaruhi variabel yang lain. Pada biplot, variabel akan digambarkan
sebagai garis berarah. Dua variabel yang memiliki nilai korelasi positif akan
digambarkan sebagai dua buah garis dengan arah yang sama atau membentuk sudut
sempit yang mengapitnya kurang dari 90o. Sementara itu, dua variabel yang
memiliki nilai korelasi negatif akan digambarkan dalam bentuk dua garis dengan
arah yang berlawanan atau membentuk sudut lebar (tumpul) yang mengapitnya
lebih dari 90o. Sedangkan dua variabel yang tidak berkorelasi akan digambarkan
dalam bentuk dua garis dengan sudut yang mendekati 900 (siku-siku).
4. Nilai peubah pada suatu objek
Dalam informasi ini digunakan untuk melihat keunggulan dari setiap objek.
Objek yang terletak searah dengan arah vektor variabel dikatakan bahwa objek
tersebut mempunyai nilai di atas rata-rata. Namun jika objek terletak berlawanan
dengan arah dari vektor variabel tersebut, maka objek tersebut memiliki nilai di
bawah rata-rata. Sedangkan objek yang hampir berada ditengah-tengah berarti
objek tersebut memiliki nilai dekat dengan rata -rata. Perlu dipahami sebelumnya
bahwa biplot adalah upaya membuat gambar di ruang berdimensi banyak menjadi
gambar di ruang berdimensi dua. Pereduksian dimensi ini mengakibatkan
menurunnya informasi yang terkandung dalam biplot. Biplot yang mampu
memberikan informasi sebesar 70% dari seluruh informasi dianggap cukup.
Hipotesis :
Kriteria Uji:
√𝜆1 0 … 0
0
𝐿 = [ 0 √𝜆2 … ⋮ ]
⋮ ⋮ …⋱
0 0 √𝜆𝑟
1 1 1
𝑈={ 𝑋𝑎1 , 𝑋𝑎2 , … , 𝑋𝑎𝑟 }
√𝜆1 √𝜆2 √𝜆𝑟
8. Menganalisis biplot.
9. Membuat kesimpulan.
D. STUDI KASUS
Sampel yang digunakan adalah cluster random sampling dari mahasiswa FST
Universitas Airlangga. Variabel yang diamati adalah variabel yang berupa : variabel yang
terkait dengan perbedaan individu yaitu jenis kelamin, pekerjaan sampingan (jika ada),
dan kebiasaan yang terkait dalam menggunakan kartu prabayar.
Variabel persepsi terhadap berbagai atribut kartu prabayar seperti denominasi pulsa
yang rendah dengan harga yang murah (PULSA) , tarif SMS dan nelpon yang murah
(TARIF), banyak menawarkan bonus (BONUS), banyak kenalan yang menggunakan kartu
prabayar yang digunakan responden (KENALAN), dan jaringan yang jarang mengalami
gangguan(JARINGAN). Data yang digunakan adalah data primer. Masing – masing
responden menilai 8 jenis kartu prabayar berdasarkan kelima variabel. Berikut ini adalah
rata-rata nilai yang diberikan responden :
Jenis Kartu
PULSA BONUS KENALAN TARIF JARINGAN
Prabayar
TRI 9,88 9,16 7,13 9,69 9,20
SIMPATI 6,32 7,50 7,71 7,49 7,89
MENTARI 4,20 5,94 5,18 6,72 4,25
IM3 7,79 8,22 7,24 7,69 7,09
AS 7,79 7,27 6,95 5,34 6,59
SMARTFREN 5,42 5,06 9,11 5,61 7,25
XL 6,18 5,69 6,25 6,01 6,26
AXIS 7,36 6,98 6,08 7,41 6,99
Asumsi yang harus dipenuhi :
1. Uji normalitas
Berdasarkan taraf nyata 0,05, terlihat bahwa semua variabel berdistribusi normal. Hal
ini dikarenakan nilai signifikan semua variabel besar dari α = 0,05.
2. Melihat kebebasan galat ( tidak ada korelasi antara variabel).
Berdasarkan hasil di atas terlihat bahwa tidak terdapat korelasi antar variabel. Hal ini
dikarenakan dengan nilai significant > α, dengan α= 0,05 atau α= 0,01.
Dari pengujian asumsi di atas didapatkan hasil bahwa tidak terjadi pelangaran asumsi
atau uji asumsi terpenuhi, maka analisis biplot dapat dapat dilakukan.
Berikut ini analisis datanya:
1. Secara manual.
1. Matriks X data :
9,88 9,16 7,13 9,69 9,20
6,32 7,50 7,71 7,49 7,89
4,20 5,94 5,18 6,72 4,25
7,79 8,22 7,24 7,69 7,09
X= 7,79 7,27 6,95 5,34 6,59
5,42 5,06 9,11 5,61 7,25
6,18 5,69 6,25 6,01 6,26
[7,36 6,98 6,08 7,41 6,99]
3. Matriks X’X :
𝜆1 = 49,5635
𝜆2 = 14,3119
𝜆3 = 5,6099
𝜆4 = 1,7274
𝜆5 = 0,4245
Matriks A :
Matriks U :
Dimana 𝑈 = 𝑋𝐴𝐿−1
0,142043 0 0 0 0
0 0,264333 0 0 0
𝐿−1 = 0 0 0,422205 0 0
0 0 0 0,760861 0
[ 0 0 0 0 1,53485]
Jika α = 0 maka 𝑮 = 𝑼, 𝑯 = 𝑨𝑳
−0,721426 0,110475 −0,162016 0,247403 −0,194482
−0,089874 −0,186752 −0,418555 −0,313937 0,745480
0,518761 0,576276 −0,297685 −0,180575 −0,183125
−0,219129 0,078003 0,027951 −0,503238 −0,411906
G = 0,023394 −0,087774 0,788824 −0,304616 0,151483
0,287726 −0,747633 −0,206991 0,111243 −0,377221
0,259795 0,042239 0,197659 0,516234 0,164268
[ −0,059247 0,215167 0,070812 0,427485 0,105503 ]
Nilai keragaman total yang mampu diterangkan oleh biplot adalah sebesar
0,891651. Ini berarti biplot mampu menjelaskan sebesar 89% dari total keragaman data
Masukkan semua variabel pada kotak Variables, Lalu pilih Scores untuk
menampilkan dialog box “factor scores”.
3. Setelah dialog box “Factor Scores” terbuka, centang “Save as variables”, kemudian pada
kotak berjudul “Method” centang “Regression”, selanjutnya klik Continue.
4. Maka akan kembali ke dialog box “Factor Analysis”, selanjutnya klik “OK”, maka akan
muncul window “Output”, dan pada Window “Data editor” jumlah kolom akan
bertambah, diantaranya ada kolom yang berjudul FAC1_1 dan FAC2_1.
5. Pilih window “Output” klik duakali pada tabel “Component Matrix”, Copy Kolom
pertama selanjutnya kembali ke Window “Data editor” Paste di kolom v1
12. Maka akan kembali ke dialog box “Overlay Scatterplot”, selanjutnya klik “OK”, maka
akan muncul window “Output” yang menghasilkan peta presepsi.
Sehingga didapatkan peta presepsi dengan garis referensi
1.0
0.5 TARIF
BONUS
Second Factor
PULSA
0.0
JARINGAN
-0.5
KENALAN
-1.0
-1.5
-2.0
b. Keragaman Peubah
Nilai keragaman dilihat dari panjang vektor yang terbentuk. Jika vektor yang
terbentuk pendek, berarti tingkat persaingan yang diberikan kecil, sedangkan vektor
yang panjang menunjukkan bahwa cara yang dilakukan operator lebih beragam
(keragamannya besar). Pada gambar terlihat bahwa terdapat empat variabel (cara yang
digunakan operator untuk bersaing) yang digambarkan dengan vektor yang panjang,
yaitu jaringan yang jarang mengalami gangguan , denominasi pulsa yang rendah dengan
harga yang murah , banyak menawarkan bonus dan tarif SMS dan nelpon yang murah.
Sedangkan banyak kenalan menggunakan kartu prabayar yang digunakan responden
digambarkan dengan vektor yang pendek, ini menunjukkan bahwa tingkat persaingan
yang disajikan terkait cara tersebut tidak terlalu beragam.