You are on page 1of 44

ANALISIS REGRESI DAN KORELASI

(Statistika Soshum)

TAHUN PERTAMA BERSAMA


UNIVERSITAS MATARAM
2017
Kompetensi Dasar

Setelah mengikuti materi pokok Analisis Regresi


dan Korelasi mahasiswa diharapkan dapat
menjelaskan dan melakukan analisis regresi dan
korelasi
Indikator

Mahasiswa dapat menjelaskan pengertian dasar


yang berkaitan analisis regresi dan korelasi.
Mahasiswa dapat melakukan analisis regresi linier
sederhana.
Mahasiswa dapat melakukan analisis regresi linier
berganda.
Mahasiswa dapat menentukan koefisien korelasi.
Dua/lebih
variabel
berpasangan

Pola Tingkat
hubungan hubungan

ANALISIS ANALISIS
REGRESI KORELASI
CONTOH

 Hubungan antara berat badan orang dewasa dengan


tinggi badan
 Hubungan nilai dengan waktu belajar siswa,
 Hubungan tekanan gas dengan suhu dan volume,
 Hubungan nilai penjualan dengan biaya promosi,
modal, dan area penjualan
 Hubungan berat badan dengan umur dan asupan
makanan.
ANALISIS REGRESI
Pengertian Analisis Regresi

 metode statistika yang mengkaji tentang pola


hubungan (bentuk fungsional) antara dua variabel atau
lebih, sehingga nilai salah satu variabel dapat diprediksi
atau diramalkan berdasarkan variabel yang lain
Variabel dalam Analisis Regresi

Variabel Prediktor/Bebas/Penjelas/Independen
• Variabel penyebab atau yang mempengaruhi,
disimbulkan dengan huruf X

Variabel Respon/Terikat/Dependen
• Variabel yang terkena akibat atau dipengaruhi,
disimbulkan dengan huruf Y
Analisis
Regresi

Linier Non Linier

Sederhana

Berganda
Analisis Regresi Linier Sederhana

 Digunakan untuk mengestimasi pola hubungan/bentuk


fungsional antara satu variabel respon Y dan satu variabel
prediktor X
 Hubungan kedua variabel tersebut diasumsikan mengikuti
pola/bentuk fungsional garis lurus
 Model umum:

𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖 + 𝜀𝑖 , 𝑖 = 1,2, … , 𝑛
 𝛽0 , 𝛽1 adalah parameter-parameter regresi, dan 𝜀𝑖 adalah
sisaan atau galat
 Mengestimasi persamaan garis regresi: menentukan
estimator parameter 𝛽0 (= 𝛽0 = 𝑏0 ) dan 𝛽1 (= 𝛽1 = 𝑏1 ).
Sehingga diperoleh persamaan garis
𝑌𝑖 = 𝑏0 + 𝑏1 𝑋𝑖 , 𝑖 = 1,2, … , 𝑛
dimana 𝑌𝑖 merupakan nilai prediksi 𝑌𝑖 pada lokasi 𝑋𝑖 .
 Garis lurus mana yang paling sesuai/tepat utk data sampel?

90
80
70
60
50
Y

40
30
20
10
0
0 20 40 60 80 100

X
Ŷi

Yi

Xi
Pilih slope b1 dan intercept b0, yang
meminimumkan beda/selisih antara nilai
pengamatan Yi dan nilai prediksi Ŷi pada lokasi Xi
yang sama.
estimasi koefisien regresi (parameter) b0 & b1
Estimasi Model Regresi Linier Sederhana

 Menggunakan metode kuadrat terkecil


 Meminimumkan jumlah kuadrat sisaan/galat
n
Q     Yi  b 0  b1 X i 
2 2
i
i 1

Q Q
 0,  0,
b 0 b1
Sehingga diperoleh persamaan normal

𝑛 𝑛
𝑛𝛽0 + 𝛽1 𝑖=1 𝑋𝑖 = 𝑖=1 𝑌𝑖
𝑛 𝑛 2 𝑛
𝛽0 𝑖=1 𝑋𝑖 + 𝛽1 𝑋
𝑖=1 𝑖 = 𝑖=1 𝑋𝑖 𝑌𝑖

Penyelesaian system persamaan linier dan penggantian


𝛽0 , 𝛽1 dengan 𝑏0 , 𝑏1 sebagai estimator akan memberikan
hasil sebagai berikut
n n

n x y i i

x i yi 
i 1
n
i 1

b1  i 1
2
 n

  xi 
 i 1 
n


i 1
xi
2

n

b0  y  b1 x
Contoh 1.
 Berdasarkan hasil penelitian Dr. A.S. Heagle di Universitas
Carolina Utara tentang pengaruh polusi ozon pada hasil
produksi tanaman kedelai, diperoleh data sebagai berikut
Hasil Produksi Tanaman Kedelai (Y) dan Konsentrasi Ozon (X)
X (ppm) Y (gr/tanaman)
0.02 242
0.07 237
0.11 231
0.15 201
𝑛 𝑛

𝑋𝑖 = 0.35 𝑌𝑖 = 911
𝑖=1 𝑖=1
𝑛 𝑛 𝑛

𝑋𝑖2 = 0.0399 𝑌𝑖2 = 208495 𝑋𝑖 𝑌𝑖 = 76.99


𝑖=1 𝑖=1 𝑖=1
0.35 911
76.99 −
𝑏1 = 4 = −293.531
0.35 2
0.0399 −
4

911 0.35
𝑏0 = — −293.531 = 253.433
4 4

Sehingga model regresi yang terbentuk adalah


𝑌𝑖 = 253.433 − 293.531𝑋𝑖
 Nilai prediksi berdasarkan nilai X yang diberikan beserta
sisaan/galat berdasarkan model yang diperoleh adalah

𝑋𝑖 𝑌𝑖 𝑌𝑖 𝑒𝑖 = 𝑌𝑖 − 𝑌𝑖

0.02 242 247.563 -5.563


0.07 237 232.887 4.113
0.11 231 221.146 9.854
0.15 201 209.404 -8.404
Analisis Regresi Linier Berganda

 suatu keadaan bisa dipengaruhi lebih dari satu faktor.


Contoh:
- hasil penjualan (Y) dipengaruhi oleh promosi (X1), dan lokasi
penjualan (X2).
- berat badan (Y) dipengaruhi oleh jumlah asupan makanan (X1)
dan umur (X2).
- indeks harga saham (Y) dipengaruhi oleh tingkat inflasi (X1), suku
bunga (X2), dan nilai tukar rupiah (X3)

 Analisis regresi berganda merupakan metode statistika yang


digunakan untuk mengestimasi pola hubungan satu variabel
respon dan dua atau lebih variabel prediktor
Model regresi linier berganda dengan p variabel prediktor:

𝑌𝑖 = 𝛽0 + 𝛽1 𝑋𝑖1 + 𝛽2 𝑋𝑖2 + ⋯ + 𝛽𝑗 𝑋𝑖𝑗 + ⋯ + 𝛽𝑝 𝑋𝑖𝑝 + 𝜀𝑖

- i menunjukkan unit pengamatan untuk variabel respon Y


dan p variabel prediktor yang diberikan.
- i = 1,2,…,n.
- Terdapat p’=(p+1) parameter regresi 𝛽𝑗 , j = 0,1,2,…,p
yang akan diestimasi.
- asumsikan bahwa n>p’.
Estimasi model regresi linier berganda

 Menggunakan metode kuadrat terkecil


 Meminimumkan jumlah kuadrat sisaan/galat

Q     Yi  b 0  b1 X i1  b 2 X i 2  ...  b p X ip 
n
2 2
i
i 1

Q Q Q
 0,  0, ... 0
b 0 b1 b p
Diperoleh persamaan normal:
n n n n

Y
i 1
i  b0 n  b1  X i1
i 1
 b2  X i 2
i 1
 ...  b p  X ip
i 1
n n n n n

X
i 1
Y  b0  X i1  b1  X
i1 i
i 1 i 1
2
i1  b2  X i1 X i 2  ...  b p  X i1 X ip
i 1 i 1
n n n n n

X
i 1
Y  b0  X i 2  b1  X i1 X i 2  b2  X
i2 i
i 1 i 1 i 1
2
i2  ...  b p  X i 2 X ip
i 1

.
.
.
n n n n n

 ip i 0  ip 1  i1 ip 1  i 2 ip
X
i 1
Y  b X  b X X  b X
i 1
X  ...
i 1
 b p X 2
ip
i 1 i 1

 Nilaib0 , b1 ,..., bp diperoleh dg menyelesaikan sistem


persamaan linier di atas
Contoh 2.

Ingin dicari model regresi dari hasil penjualan(Y), dengan


variabel bebas berupa biaya iklan (X1) dan biaya untuk
kontrol kualitas (X2) selama 10 tahun terakhir.

Tahun 1 2 3 4 5 6 7 8 9 10

X1 10 9 11 12 11 12 13 13 14 15
X2 3 4 3 3 4 5 6 7 7 8
Y 44 40 42 46 48 52 54 58 56 60
No. Y 𝑋1 𝑋2 𝑌2 𝑋1 𝑌 𝑋2 𝑌 𝑋12 𝑋22
1 44 10 3 440 132 100 9 30
2 40 9 4 360 160 81 16 36
3 42 11 3 462 126 121 9 33
4 46 12 3 552 138 144 9 36
5 48 11 4 528 192 121 16 44
6 52 12 5 624 260 144 25 60
7 54 13 6 702 324 169 36 78
8 58 13 7 754 406 169 49 91
9 56 14 7 784 392 196 49 98
10 60 15 8 900 480 225 64 120
Total 500 120 50 6106 2610 1470 282 626
500  10 b0  120 b1  50 b2
6106  120 b0  1470 b1  626 b2
2610  50 b0  626 b1  282 b2

Dengan menyelesaikan sistem persamaan


linier di atas diperoleh nilai-nilai b0 = 17.944;
b1 = 1.873 dan b2 = 1.916
 nilai prediksi berdasarkan nilai X1 dan X2 yang diberikan
beserta sisaan/galat berdasarkan model yang diperoleh

𝑋1𝑖 𝑋2𝑖 𝑌𝑖 𝑌𝑖 𝑒𝑖 = 𝑌𝑖 − 𝑌𝑖

10 3 44 42.422 1.578
9 4 40 42.465 -2.465
11 3 42 44.295 -2.295
12 3 46 46.168 -0.168
11 4 48 46.211 1.789
12 5 52 50.000 2.000
13 6 54 53.789 0.211
13 7 58 55.705 2.295
14 7 56 57.578 -1.578
15 8 60 61.367 -1.367
Analisis Korelasi
 metode statistika yang mengkaji tentang
tingkat/derajat (seberapa kuat) hubungan antara dua
variabel atau lebih.
 dilakukan dengan menentukan koefisien korelasi (r),
yaitu suatu ukuran yang menunjukkan arah dan tingkat
kuat hubungan antara dua variabel atau lebih.
 Besarnya koefisien korelasi ∶ −1 ≤ 𝑟 ≤ +1.
Y Y Y

X X X
r<0 r=0 r>0

Nilai Koefisien Interpretasi


Korelasi
0.00 – 0.199 Sangat lemah
0.20 – 0.399 Lemah
0.40 – 0.599 Sedang
0.60 – 0.799 Kuat
Koefisien korelasi sederhana

• Korelasi antara satu variabel respon Y dan satu


variabel prediktor X

Koefisien korelasi ganda

• Korelasi antara satu variabel respon Y dengan p


variabel predictor X1, X2,…, Xp

Koefisien korelasi parsial

• Korelasi antara satu variabel respon Y dengan


satu variabel predictor apabila variabel predictor
lain dianggap konstan
Korelasi linier sederhana

 Ditentukan dengan koefisien korelasi Pearson (Pearson’s


Product Moment)

𝑛 𝑛 𝑛
𝑛 𝑖=1 𝑥𝑖 𝑦𝑖 − 𝑖=1 𝑥𝑖 𝑖=1 𝑦𝑖
𝑟=
𝑛 2 𝑛 2 𝑛 2 𝑛 2
𝑛 𝑥
𝑖=1 𝑖 − 𝑖=1 𝑥𝑖 𝑛 𝑦
𝑖=1 𝑖 − 𝑖=1 𝑦𝑖
Contoh 3

Misalkan diketahui data besarnya pendapatan (X)


dengan pengeluaran/konsumsi per bulan (Y) sebagai
berikut
Pendapatan (X) 800 900 700 500 700 900 800 600
(dalam ribuan)
Konsumsi (Y) 300 300 200 100 200 400 200 200
(dalam ribuan

Berdasarkan data tersebut, tentukan koefisien korelasi


antara pendapatan dan konsumsi per bulan
Jawab:
No. X Y X2 Y2 XY
1 800 300 640000 90000 240000
2 900 300 810000 90000 270000
3 700 200 490000 40000 140000
4 500 100 250000 10000 50000
5 700 200 490000 40000 140000
6 900 400 810000 160000 360000
7 800 200 640000 40000 160000
8 600 200 360000 40000 120000
Total 5900 1900 4490000 510000 1480000

8 1480000 − 5900 1900


𝑟= = 0.872228
8 4490000 − 5900 2 8 510000 − 1900 2
Koefisien Korelasi Ganda

Korelasi Y dengan X1 dan X2

2 2
𝑟𝑦𝑥1
+ 𝑟𝑦𝑥2 − 2𝑟𝑦𝑥1 𝑟𝑦𝑥2 𝑟𝑥1 𝑥2
𝑅𝑦𝑥1 𝑥2 =
1 − 𝑟𝑥21 𝑥2

dengan 𝑟𝑦𝑥1 = koefisien korelasi sederhana antara Y dan X1


𝑟𝑦𝑥2 = koefisien korelasi sederhana antara Y dan X2
𝑟𝑥1𝑥2 = koefisien korelasi sederhana antara X1 dan X2
Korelasi Y dengan X1, X2, …, Xp

𝑏1 𝑥1 𝑦+𝑏2 𝑥2 𝑦+⋯+𝑏𝑖 𝑥𝑖 𝑦+⋯+𝑏𝑝 𝑥𝑝 𝑦


𝑅𝑦𝑥1 𝑥2. …𝑥𝑖 …𝑥𝑝 =
𝑦2

𝑛 𝑛
𝑗=1 𝑥𝑖𝑗 𝑗=1 𝑦𝑗
dengan 𝑥𝑖 𝑦 = 𝑛
𝑗=1 𝑥𝑖𝑗 𝑦𝑗 − , 𝑖 = 1,2, … , 𝑝
𝑛
2
𝑛
𝑛 2 𝑗=1 𝑦𝑗
𝑦2 = 𝑦
𝑗=1 𝑗 −
𝑛
𝑏𝑖 = koefisien regresi masing-masing variabel prediktor,
untuk 𝑖 = 1,2, … , 𝑝
Contoh 4

Berdasarkan data pada contoh 2, tentukan koefisien


korelasi ganda antara hasil penjualan (Y) dengan biaya
iklan (X1) dan biaya untuk kontrol kualitas (X2).
Jawab
Ditentukan nilai koefisien-koefisien korelasi sederhana berikut

𝑛 𝑛 𝑛
𝑛 𝑖=1 𝑥1𝑖 𝑦𝑖 − 𝑖=1 𝑥1𝑖 𝑖=1 𝑦𝑖
𝑟𝑦𝑥1 =
𝑛 2 𝑛 2 𝑛 2 𝑛 2
𝑛 𝑖=1 𝑥1𝑖 − 𝑖=1 𝑥1𝑖 𝑛 𝑖=1 𝑦𝑖 − 𝑖=1 𝑦𝑖
10 6106 − 120 500
=
10 1470 − 120 2 10 25440 − 500 2

= 0.9226

𝑛 𝑛 𝑛
𝑛 𝑖=1 𝑥2𝑖 𝑦𝑖 − 𝑖=1 𝑥2𝑖 𝑖=1 𝑦𝑖
𝑟𝑦𝑥2 =
𝑛 2 𝑛 2 𝑛 2 𝑛 2
𝑛 𝑥
𝑖=1 2𝑖 − 𝑥
𝑖=1 2𝑖 𝑛 𝑦
𝑖=1 𝑖 − 𝑦
𝑖=1 𝑖
10 2610 − 50 500
= = 0.9270
2 2
𝑛 𝑛 𝑛
𝑛 𝑖=1 𝑥1𝑖 𝑥2𝑖 − 𝑖=1 𝑥1𝑖 𝑖=1 𝑥2𝑖
𝑟𝑥1 𝑥2 =
𝑛 2 𝑛 2 𝑛 2 𝑛 2
𝑛 𝑖=1 𝑥1𝑖 − 𝑖=1 𝑥1𝑖 𝑛 𝑖=1 𝑥2𝑖 − 𝑖=1 𝑥2𝑖
10 626 − 120 50
= = 0.8391
10 1470 − 120 2 10 282 − 50 2

Hasil tersebut dimasukan ke rumus koefisien korelasi ganda, sehingga

0.92262 + 0.92702 − 2 0.9226 0.9270 0.8391


𝑅𝑦𝑥1 𝑥2 = = 0.9644
1 − 0.83912
Koefisien korelasi parsial

Untuk variabel-variabel Y, X1, dan X2

𝑟𝑦𝑥1 −𝑟𝑦𝑥2 𝑟𝑥1 𝑥2


𝑟𝑦𝑥1 . 𝑥2 =
2
1−𝑟𝑦𝑥 1−𝑟 2
2 𝑥 1 𝑥2

𝑟𝑦𝑥2 − 𝑟𝑦𝑥1 𝑟𝑥1 𝑥2


𝑟𝑦𝑥2 . 𝑥1 =
2 2
1 − 𝑟𝑦𝑥1
1 − 𝑟𝑥 1 𝑥2
Untuk variabel-variabel Y, X1, X2, dan X3

𝑟𝑦𝑥1 . 𝑥2 − 𝑟𝑦𝑥3 . 𝑥2 𝑟𝑥1 𝑥3 . 𝑥2


𝑟𝑦𝑥1 . 𝑥2 𝑥3 =
2
1−𝑟𝑦𝑥 1−𝑟 2
.
3 2𝑥 𝑥 1 𝑥3 . 𝑥2

𝑟𝑦𝑥2 . 𝑥1 − 𝑟𝑦𝑥3 . 𝑥1 𝑟𝑥2 𝑥3 . 𝑥1


𝑟𝑦𝑥2 . 𝑥1 𝑥3 =
2
1−𝑟𝑦𝑥 1−𝑟 2
.
3 1𝑥 𝑥 2 𝑥3 . 𝑥1

𝑟𝑦𝑥3 . 𝑥1 − 𝑟𝑦𝑥2 . 𝑥1 𝑟𝑥2 𝑥3 . 𝑥1


𝑟𝑦𝑥3 . 𝑥1 𝑥2 =
2 2
1 − 𝑟𝑦𝑥2 . 𝑥1
1 − 𝑟𝑥 2 𝑥3 . 𝑥1
Contoh 5.

Berdasarkan contoh 6.2 dan 6.4, tentukan korelasi parsial


antara Y dan X1 dengan mengagnggap X2 konstan
(𝑟𝑦𝑥1 . 𝑥2 ).
Jawab

Dari contoh 4 diperoleh


𝑟𝑦𝑥1 = 0.9226, 𝑟𝑦𝑥2 = 0.9270, dan 𝑟𝑥1 𝑥2 = 0.8391

Sehingga diperoleh

0.9226 − 0.9270 0.8391


𝑟𝑦𝑥1 . 𝑥2 = = 0.7095
1 − 0.92702 1 − 0.83912