Professional Documents
Culture Documents
Analisis korelasi digunakan untuk mengukur kekuatan hubungan linier antara dua
variabel. Koefisien korelasi populasi (rho) adalah ukuran kekuatan hubungan
linier antara dua variabel dalam populasi sedangkan koefisien korelasi sampel r
adalah estimasi dari dan digunakan untuk mengukur kekuatan hubungan linier
dalam sampel observasi. Untuk selanjutnya r disebut Koefisien Korelasi Pearson
Product Momernt.
6.2.1. Korelasi Pearson (Product Moment)
Korelasi pearson sering juga disebut sebagai korelasi produk-momen atau
korelasi saja. Korelasi pearson termasuk ke dalam statistika parametrik. Besarnya
koefisien menggambarkan seberapa erat hubungan linear antara dua variabel,
bukan hubungan sebab akibat. Variabel yang terlibat dua-duanya bertipe numerik
(interval atau rasio), dan menyebar normal jika ingin pengujian terhadapnya sah.
Berikut ini pedoman menentukan kuat tidaknya korelasi antara dua variabel
menurut Walpole :
Tabel 1.
Interval Koefisien
Tingkat Hubungan
0.00 0.199
0.20 0.399
0.40 0.599
0.60 0.799
0.80 1.000
Sangat rendah
Rendah
Cukup
Kuat
Sangat Kuat
Tabel 2.
Interval Hubungan
Tingkat Hubungan
Tidak
>0 0,25
>0,25 0,5
>0,5 0,75
>0,75 0,99
1
variabel
Korelasi sangat lemah
Korelasi cukup
Korelasi kuat
Korelasi sangat kuat
Korelasi sempurna
ada
korelasi
antara
dua
Hasil dari analisis korelasi menunjukkan kekuatan atau kelemahan dari suatu
hubungan.Nilai koefisien korelasi ini akan berada pada kisaran -1 sampai dengan
+1.
pengaruh yang terjadi adalah pengaruh negatif. Dalam pengaruh yang negatif ini
kenaikan suatu variabel akan menyebabkan penurunan suatu variabel yang lain,
sedangkan penurunan suatu variabel akan menyebabkan kenaikan variabel yang
lain.
Koefisien korelasi positif menunjukkan hubungan yang searah dari dua variabel,
dimana kenaikan suatu variabel akan menyebabkan kenaikan variabel yang lain
dan sebaliknya penurunan suatu variabel akan menyebabkan penurunan variabel
yang lain.
Koefisien korelasi sebesar nol menunjukkan tidak adanya hubungan antara dua
variabel, dengan kata lain kenaikan atau penurunan suatu variabel tidak
mempengaruhi variabel yang lain, jadi berapapun perubahan harga pada suatu
variabel tidak akan mempengaruhi variabel yang lain karena nilainya yang tetap.
Terdapat bermacam-macam analisis korelasi yang dapat digunakan untuk
mengukur hubungan asosiatif dari suatu variabel. Korelasi yang akan digunakan
tergantung pada jenis data yang akan dianalisis. Korelasi berdasarkan tingkatan
data dapat dilihat pada tabel berikut ini:
Teknik
Korelasi
yang
Digunakan
Nominal
Koefisien Kontingensi
Ordinal
Spearman Rank
Kendal Tau
( x x )( y y )
[ ( x x ) ][ ( y y )
]
Koefisien korelasi pearson diformulasikan sebagai
berikut:
n xy x y
[n( x 2 ) ( x ) 2 ][ n( y 2 ) ( y ) 2 ]
Atau:
Atau:
r=b
S xx
S xy
=
S yy S xx S yy
dimana:
r = Koefisien Korelasi Sampel
n = Ukuran Sampel
x = Nilai dari Variabel Independen
y = Nilai Variabel dependen
Dari persaamaan korelasi yang terakhir tersebut dapat dilihat adanya hubungan
antara b dan r. r digunakan untuk mengukur hubungan linier antara x dan y,
sedangkan b mengukur perubahan dalam y akibat perubahan setiap unit x.
Dalam kasus dimanai r1 = 0,3 dan r2 = 0,6 hanya berarti bahwa terdapat korelasi
positif dimana r2 lebih kuat daripada r1. Adalah salah jika menyimpulkan bahwa r2
mengindikasikan hubungan linier dua kali lebih baik dibandingkan dengan r1.
6.2.2.Koefisien Determinansi
Koefisien determinansi adalah salah satu alat analisis yang dapat digunakan untuk
mengetahui lebih jauh hubungan antar variabel. Koefisien determinansi
suatu model besar belum tentu model tersebut adalah model yang baik,
tetapi jika MSE model kecil maka model teresbut adalah model regresi yang
terbaik.
Koefisien
determinasi
biasanya
dinyatakan
dengan
persen.
Sedangkan
X 1 , X 2 ,..., X k
serentak dengan variabel terikat. Misalkan ada k variabel bebas,
dan satu variabel terikat Y dalam suatu persamaan regresi linear maka besarnya
korelasi bergandanya adalah :
r y , x , , x =
1
a 1 x 1 y + a2 x 2 y+ +a k x k y
dengan
y2
x 1 y = X 1 Y
x k y= X k Y
X1 Y
n
Xk Y
n
2
y = Y
( Y )
n
ryx
1
(1r
r y, x
2
x1 x2
, x2
) (1r 2y x )
2
Dimana :
ry,x ,x
1
ryx
ryx
rx
x2
H0
:=0
H1
:0
Statistik uji:
hitung
b
S
SSR
S
xx
r n2
1r 2
berikut:
atau
t tabel =t
( ;df )
2
dimana df =n2
Kriteria uji
Tolak H0 jika thitung > ttabel atau thitung < -ttabel
Kesimpulan
Sementara untuk menguji hipotesis koefisien korelasi dengan menggunakan
koefisien korelasi taksiran (
H 0 : =0
dimana
0 0
H 1 : 0
z hitung =
Statistik uji:
z tabel=z
(1+r ) ( 10 )
n3
ln
2
( 1r ) ( 1+ 0 )
z tabel=z
2
Kriteria uji:
Tolak H0 jika zhitung > ztabel atau zhitung < -ztabel
Kesimpulan
6.4.Analisis Regresi
Dalam kehidupan sehari-hari, seringkali dijumpai kasus yang berhubungan dengan dua
variabel atau lebih. Hubungan tersebut dapat berupa hubungan kausal atau hubungan
fungsional. Hubungan kausal misalnya : hubungan antara panas dengan tingkat muai
panjang, sedangkan hubungan fungsional contohnya: hubungan antara kepemimpinan
dengan tingkat kepuasan kerja pegawai.
Secara umum terdapat dua macam hubungan antara dua variabel atau lebih, yaitu :
Keeratan hubungan dapat diketahui dengan analisis korelasi (bukan hubungan sebabakibat)
Bentuk hubungan dapat diketahui dengan analisis regresi
6.4.1. Sejarah Regresi
Sejarah Regresi dimulai ketika Sir Francis Galton (1822-1911) yang membandingkan
tinggi badan anak laki-laki dengan tinggi badan ayahnya. Galton menunjukkan bahwa
tinggi anak laki-laki dari ayah yang tinggi setelah beberapa generasi cenderung mundur
(regressed) mendekati nilai populasi. Dengan kata lain, anak laki- laki dari ayah yang
badannya sangat tinggi, cenderung lebih pendek dari ayahnya. Sedangkan anak laki-laki
dari ayah yang badannya sangat pendek cenderung lebih tinggi dari ayahnya. Sekarang
istilah regresi diterapkan pada semua peramalan.
6.4.2. Definisi Regresi
Regresi merupakan salah satu metoda dalam analisis statistika yang digunakan untuk
menganalisis dan memodelkan secara matematis hubungan diantara dua variabel atau
lebih. Pada analisis regresi ini dikenal adanya variabel dependen (variabel tak
bebas/variabel
tergantung/Unknown
independen (variabel
Variabls/).
bebas/
Variable/Response
Variable)
dan
variabel
disebut juga sebagai variabel tergantung dan variabel kedua disebut juga sebagai
variabel bebas. Jika variabel bebas lebih dari satu, maka analisis regresi disebut regresi
linear berganda. Disebut berganda karena pengaruh beberapa variabel bebas akan
dikenakan kepada variabel tergantung. Saat ini, analisis regresi banyak digunakan untuk
menelaah hubungan dua variabel atau lebih dan menentukan pola hubungan yang
modelnya belum diketahui, sehingga regresi secara aplikatif lebih bersifat eksploratif.
6.4.3. Asumsi
Penggunaan regresi linear sederhana didasarkan pada asumsi diantaranya sbb:
Catatan (*):
Residual adalah selisih antara nilai duga (predicted value) dengan nilai pengamatan
pengamatan sebenarnya.
Perbedaan keduanya: residual dari data sampel, error dari data populasi.
sebagai berikut:
Keterangan :
^
yi
= nilai estimasi dari variabel bebas. juga merupakan variabel terikat (dependen
variable)
a = konstanta yang merupan nilai estimasi
^y
6.4.5.1.
e2i =
i=1
SSE=L=
i =1
x ix
(Y iab ())=0
n
L
=2
a
i=1
n xy x y
n x 2 x
atau
Dari persamaan di atas disubstitusi, maka diperoleh persamaan untuk menentukan nilai
n
a: a =
yi
xi
i=1
b i=1
n
n
atau:
a=
Dimana:
b x
= rata rata yi
x = rata rata x
i
6.4.5.2.
model dan variansi yang disebabkan karena kesalahan eksperimen. Dekomposisi varians
dapat dijabarkan sebagai berikut:
SST = SSR + SSE
Keterangan:
SST = Sum of Square Total / Jumlah Kuadrat Total =
S yy
S yy
S xy
S xy
Dimana :
S xx = x i2n x 2
S yy = y i2n y 2
S xy = x i y in x y
2
6.4.5.3. Estimasi dari
Se
) atau yang
dan diestimasi
=S=
( y ^y )2
n2
SSE
n2
S yyb S xy
n2
sb
6.4.5.3.
S xx
(x x) 2
s
( x) 2
x
n
2
Jika nilai x dimasukkan berulangulang pada persamaan regresi, maka nilai ratarata
yang diperoleh tidak akan sama, yang artinya nilai
standar error
S y
= Se
( (
2
1 ( x 0 x )
+
n
S xx
))
Hipotesis:
H0 : = 0
H1 : 0
Statistik Uji:
a
t=
s
xi
n S xx
Pengambilan Keputusan
Tolak H0 jika thitung > t a/2(db= n-2) pada selang kepercayaan
Kesimpulan
6.4.8. Selang Kepercayaan
Selang Kepercayaan untuk :
a t/2
xi
nS xx
b t/2s b
6.4.9.Prediksi
Estimasi selang keyakinan untuk Rata-rata y, diberikan pada saat xp
y t/2s
2
1 (x p x)
n (x x) 2
y t/2s
2
1 (x p x)
1
n (x x) 2
SS
df
SSR
SSE
SST
1
n2
n1
MS
MSR = SSR/1
S2 = SSE/n-2
Fhitung
MSR/s2
Pengambilan Keputusan
Tolak H0 jika Fhitung > Ftabel(1 , n-2) pada selang kepercayaan (level of significance)
Kesimpulan
6.6.
Analisis Residual
Analisis residual dapat dilakukan dengan:
a. Pengujian Unequal variances: Varians pada setiap nilai x harus identik, yaitudengan
melakukan plot
e^i
dengan
e^i
dengan
time order (i). Jika ada pola tertentu, maka terjadilah dependent residual dimana
penyebabnya
dapat
karena
kesalahan
eksperimen
atau
kesalahan
dalam
plot e^i
dengan
6.7.
model yang dihasilkan sudah memenuhi atau tidak. Untuk menggambarkan kondisi
tersebut diatas dilakukan pengujian kecocokan model dengan pendekatan Lack Of Fit.
Hipotesis
H0 : Tidak ada LoF
H1 : Ada LoF Model Linier tidak sesuai
Tentukan daerah kritis dengan Level of Significance () yang biasa digunakan adalah
yi .
y ij
dengan df = n k
i=1
SS pe =
i=1
SS
SSR
df
1
SSE
n
2
MS
Fhitung
MSR = SSR/1
MSR/s2
S2 = SSE(/n-2)
Lof
SSE
Pure error
- k-2
SSpe
SSpe /( k2)
SSpe
Total
(SSE
n-k
SST
S2= SSpe
SSESSpe
S2 (k2)
/(n-k)
Pengambilan Keputusan
Tolak H0 jika Fhitung > Ftabel(k-2 , n-k) pada selang kepercayaan (level of significance)
Kesimpulan
Contoh 1
nilai 9 mahasiswa dari suatu kelas pada ujian tengah semester (x) dan pada ujian akhir
semester (y) sebagai berikut :
n
xi
yi
1
77
82
2
50
66
3
71
78
4
72
34
5
81
47
6
94
85
7
96
99
8
99
99
9
67
68
1
77
82
631
4
592
9
Sehingga b =
dan
2
50
66
330
0
250
0
3
71
78
5538
4
72
34
2448
5
81
47
3807
6
94
85
7990
7
96
99
9504
8
99
99
9801
9
67
68
4556
707
658
53258
5041
5184
6561
8836
9216
9801
4489
57557
= 0,777142
a=
= 12,06232
Contoh 2
Lakukan uji regresi dengan pendekatan ANOVA pada :
x 3,4
y 25
2,8
20
2,5
18
3,7
25
3,2
21
3,1
22
2,9
30
3
22
2,2
10
2,4
20
Jawab :
x = 31,9
y = 230
xiyi = 675,5
xi2 = 94,49
yi2 = 4866
x = 2,9
y = 20,9091
b = 0,777142
a = 12,06232
SS
df
MS
Fhitung
gresi
Regresi
36,4
36,49
16,08
2
7
6
2,7
17
Error
20,4
Total
56,9
2,27
2
10
0
4
9
Pengambilan Keputusan
F tabel = F(0.05;1,9) = 5,12
Karena Fhitung > Ftabel maka Ho ditolak
Kesimpulan:Model Regresi linier sesuai
Contoh 3
Berikut adalah data jumlah biaya promosi (x) dan jumlah penjualan (y) pada perusahaan
ABC.
Tahun
2005
22
30
2006
36
38
2007
31
35
2008
32
37
2009
31
34
2010
32
38
Jumlah
Jumlah
Range
Range
Biaya
Penjuala
d i=R ( x )R( y )
di
Promos
i (x)
n (y)
2005
22
30
2006
36
38
5.5
0.5
0.25
2007
31
35
2.5
-0.5
0.25
2008
32
37
4.5
0.5
0.25
2009
31
34
2.5
0.5
0.25
2010
32
38
4.5
5.5
-1
r s =1
6(2)
12
=1
=10 , 057=0 , 943
2
210
6(6 1)
Uji Hipotesis:
H0 : Tidak ada hubungan yang signifikan antara variabel biaya promosi dengan variabel
penjualan
H1 : Ada hubungan yang signifikan antara variabel biaya promosi dengan variabel
penjualan.
Statistika uji:
r n2 ( 0 , 943 ) 62
1 ,886
t hitung = 2 =
=
=17 ,03
2
0 , 11075
1r
1( 0 , 943 )
t tabel =t
=4 , 604
(0 ,201 ; 4)
LATIHAN SOAL:
1. Data berikut menyatakan IQ=X untuk kelompok anak berumur tertentu dan hasil ujian
prestasi pengetahuan umum (Y).
Xi
Yi
Xi
Yi
Yi
Yi
114
110
113
137
116
132
90
121
107
120
125
92
29
41
48
73
55
80
40
75
43
64
53
31
130
142
137
140
125
134
106
121
111
126
95
105
71
68
69
66
39
78
49
59
66
67
46
47
96
89
105
125
107
97
134
106
99
98
117
100
45
32
50
57
59
48
55
45
47
59
47
49
a.
b.
c.
d.
e.
f.
Jelaskan artinya!
Tentukan interval kepercayaan 95% untuk seorang anak dengan IQ=120. Jelaskan
g.
artinya!
Tentukan interval kepercayaan 95% untuk perubahan rata-rata prestasi jika IQ berubah
h.
i.
Y (gram)
0
8
6
8
15
12
10
14
30
25
21
24
45
31
33
28
60
44
39
42
75
48
51
44
Carilah persamaan garis regresi
Gambarkan garis tersebut pada diagram pencar
Taksirlah banyaknya senyawa yang larut dalam 100 g air pada 50oC.
4. Berikut adalah data banyaknya modal (dalam juta rupiah) dan keuntungan yang diperoleh
(dalam juta rupiah) yang dihasilkan dalam waktu 10 bulan.
Modal (x)
Keuntungan
189
10
204
15
192
13
214
17
218
19
178
14
189
13
167
11
180
13
194
15
(y)
a. Hitunglah koefisien korelasi Pearson dan determinasi berdasarkan data di atas dan ujiah!
b. Tentukan apakah pernyataan bahwa koefisien korelasi antara jumlah karyawan dan
keuntungan tidak lebih dari 0,7 adalah benar! Gunakan tingkat kesalahan 5%!
5.
Hitunglah koefisien korelasi kondisi temperatur (x) dan kepuasan pekerja (y) serta
apakah
ada hubungan yang signifikan antara keduanya dengan menggunakan teknik korelasi
pearson!
Kondisi
temperatur
KepuasanKerja
(x)
(y)
20
12
20
10
17
18
19
20
12
18
10
19
12
16
10
17
11
10
16
12
12
17
13
12
18
14
12
12
15
12
17
6. Dibawah ini diberikan data yang secara acak diambil dari populasi normal bervariabel
dua (X dan Y).
15
13
10
11
16
12
9
12
4
8
108
106
99
110
135
97
74
98
20.
69
8
11
17
20
12
18
16
13
18
11
56
75
137
163
84
149
140
137
170
109
17
6
8
5
3
6
14
5
15
16
153
73
95
26
24
50
96
35
132
141
I.1.1
bebas (x) dan variabel terikat (y). Namun pada regresi linier berganda ini, variabel bebas (x)
yang digunakan lebih dari dari satu. Bentuk persamaan umum untuk model regresi linier
berganda:
^y = a + b1 x1 +b 2 x 2 + +b n x n
Keterangan:
^y = nilai dari variabel terikat
a
^y
x n = variabel bebas
I.1.1.1 Metode Kuadarat Terkecil (Least-Squares Method)
( x 1i , x 2i ; y i ) ;i =1,2, , n
Untuk setiap pengamatan
akan memenuhi persamaan:
{ }
^y = a + b1 x1 +b 2 x 2 + +b n x n +e i
b1
, dan
b2
persamaan:
yi
x i1 + b1 x i2
= an + b1
i=1
i=1
x1 i yi
i=1
n
x2 i yi
i=1
x i1 x i2
+ b2
i=1
x 2 i + b2 x i2
=a
i=1
i=1
x i1 x 2i
+ b1
i=1
i=1
n
x
+ b1
i=1
2
i1
=a
x1 i
Asumsi yang digunakan dalam analisis regresi linier berganda antara lain:
a. Setiap nilai error berdistribusi normal dengan ratarata 0 dan dan varians 2
b. Bersifat homoskedastisitas
c. Kovarian error = 0, tidak terjadi autokorelasi
d. Tidak terdapat multikolinieritas, artinya tidak terdapat hubungan linier yang sempurna
diantara variabelvariabel bebas.
Latihan soal
1. Dari tabel berikut ini:
X (oC)
Y (gram)
0
8
6
8
15
12
10
14
30
25
21
24
45
31
33
28
60
44
39
42
75
48
51
44
a. Carilah persamaan garis regresi
b. Gambarkan garis tersebut pada diagram pencar
c. Taksirlah banyaknya senyawa yang larut dalam 100 g air pada 50oC.
2. Lakukan uji model regresi pada soal no.1.