You are on page 1of 28

BAB VI

ANALISIS KORELASI DAN REGRESI LINIER SEDERHANA


6.0. Tujuan Pembelajaran:
Mahasiswa Mampu:
1. Menghitung dan menginterpretasikan korelasi sederhana antara dua variabel
2. Mengetahui hubungan dua variabel yang tidak linier
3.
4.
5.
6.

Menentukan korelasi dan mengujinya


Menghitung dan menginterpretasikan persamaan regresi linier sederhana
Mengetahui asumsi yang digunakan dalam analisa regresi
Menentukan Model Regresi yang Layak

7. Menghitung dan Menginterpretasikan Interval Keyakinan untuk Koefisien


Regresi
8. Mengetahui bahwa analisis regresi dapat digunakan sebagai alat prediksi
9. Mengetahui bagaimana menerapkan kasus nyata yang berhubungan dengan
analisis regresi secara benar

6.1. Scatter Plot


Sebelum menentukan bentuk hubungan dengan analisis regreis linier atau
sebelum mengukur keeratan hubungan antara dua variabel, harus dilihat apakah
variabel-variabel tersebut mempunyai hubungan linier atau tidak dengan
menggunakan scatter plot seperti yang dibawah ini:
Grafik 1.Scatter Plot (Diagram Pencar)

Dalam scatter plot diatas ada empat kriteria,yaitu:


Bila titik-titik menggerombol mengikuti sebuah garis lurus dengan kemiringan
positif, maka kedua variabel dinyatakan memiliki hubungan linier positif
Bila titik-titik menggerombol mengikuti sebuah garis lurus dengan kemiringan
negatif, maka kedua variabel dinyatakan memiliki hubungan linier negatif
Bila titik-titik menggerombol tidak mengikuti garis lurus, maka kedua variabel
dinyatakan tidak memiliki hubungan yang linier
Bila titik-titik memencar atau membentuk suatu garis lurus mengikuti sebuah
pola yang acak atau tidak ada pola, maka kedua variabel dinyatakan tidak
memilki hubungan.
6.2. Analisis Korelasi

Analisis korelasi digunakan untuk mengukur kekuatan hubungan linier antara dua
variabel. Koefisien korelasi populasi (rho) adalah ukuran kekuatan hubungan
linier antara dua variabel dalam populasi sedangkan koefisien korelasi sampel r
adalah estimasi dari dan digunakan untuk mengukur kekuatan hubungan linier
dalam sampel observasi. Untuk selanjutnya r disebut Koefisien Korelasi Pearson
Product Momernt.
6.2.1. Korelasi Pearson (Product Moment)
Korelasi pearson sering juga disebut sebagai korelasi produk-momen atau
korelasi saja. Korelasi pearson termasuk ke dalam statistika parametrik. Besarnya
koefisien menggambarkan seberapa erat hubungan linear antara dua variabel,
bukan hubungan sebab akibat. Variabel yang terlibat dua-duanya bertipe numerik
(interval atau rasio), dan menyebar normal jika ingin pengujian terhadapnya sah.
Berikut ini pedoman menentukan kuat tidaknya korelasi antara dua variabel
menurut Walpole :
Tabel 1.
Interval Koefisien

Tingkat Hubungan

0.00 0.199
0.20 0.399
0.40 0.599
0.60 0.799
0.80 1.000

Sangat rendah
Rendah
Cukup
Kuat
Sangat Kuat

Menurut Sarwono (2006) Batas-batas nilai koefisien korelasi diinterpretasikan


sebagai berikut:

Tabel 2.

Interval Hubungan

Tingkat Hubungan

Tidak

>0 0,25
>0,25 0,5
>0,5 0,75
>0,75 0,99
1

variabel
Korelasi sangat lemah
Korelasi cukup
Korelasi kuat
Korelasi sangat kuat
Korelasi sempurna

ada

korelasi

antara

dua

Hasil dari analisis korelasi menunjukkan kekuatan atau kelemahan dari suatu
hubungan.Nilai koefisien korelasi ini akan berada pada kisaran -1 sampai dengan
+1.

Koefisien korelasi minus menunjukkan hubungan yang terbalik, dimana

pengaruh yang terjadi adalah pengaruh negatif. Dalam pengaruh yang negatif ini
kenaikan suatu variabel akan menyebabkan penurunan suatu variabel yang lain,
sedangkan penurunan suatu variabel akan menyebabkan kenaikan variabel yang
lain.
Koefisien korelasi positif menunjukkan hubungan yang searah dari dua variabel,
dimana kenaikan suatu variabel akan menyebabkan kenaikan variabel yang lain
dan sebaliknya penurunan suatu variabel akan menyebabkan penurunan variabel
yang lain.
Koefisien korelasi sebesar nol menunjukkan tidak adanya hubungan antara dua
variabel, dengan kata lain kenaikan atau penurunan suatu variabel tidak
mempengaruhi variabel yang lain, jadi berapapun perubahan harga pada suatu
variabel tidak akan mempengaruhi variabel yang lain karena nilainya yang tetap.
Terdapat bermacam-macam analisis korelasi yang dapat digunakan untuk
mengukur hubungan asosiatif dari suatu variabel. Korelasi yang akan digunakan
tergantung pada jenis data yang akan dianalisis. Korelasi berdasarkan tingkatan
data dapat dilihat pada tabel berikut ini:

Tabel.3 Korelasi Berdasarkan Tingkatan Data


Tipe / Tingkat Data

Teknik

Korelasi

yang

Digunakan
Nominal

Koefisien Kontingensi

Ordinal

Spearman Rank
Kendal Tau

Interval dan rasio

Pearson / Produk Momen


Korelasi Ganda
Korelasi Parsial.

( x x )( y y )
[ ( x x ) ][ ( y y )

]
Koefisien korelasi pearson diformulasikan sebagai

berikut:

n xy x y

[n( x 2 ) ( x ) 2 ][ n( y 2 ) ( y ) 2 ]
Atau:

Atau:

r=b

S xx
S xy
=
S yy S xx S yy

dimana:
r = Koefisien Korelasi Sampel
n = Ukuran Sampel
x = Nilai dari Variabel Independen
y = Nilai Variabel dependen
Dari persaamaan korelasi yang terakhir tersebut dapat dilihat adanya hubungan
antara b dan r. r digunakan untuk mengukur hubungan linier antara x dan y,
sedangkan b mengukur perubahan dalam y akibat perubahan setiap unit x.
Dalam kasus dimanai r1 = 0,3 dan r2 = 0,6 hanya berarti bahwa terdapat korelasi
positif dimana r2 lebih kuat daripada r1. Adalah salah jika menyimpulkan bahwa r2
mengindikasikan hubungan linier dua kali lebih baik dibandingkan dengan r1.
6.2.2.Koefisien Determinansi
Koefisien determinansi adalah salah satu alat analisis yang dapat digunakan untuk
mengetahui lebih jauh hubungan antar variabel. Koefisien determinansi

disimbolkan dalam R2 yang menyatakan proporsi variansi keseluruhan dalam nilai


variabel dependen yang dapat diterangkan oleh hubungan linier dengan variabel
independen atau menunjukkan proporsi total variasi dalam nilai variabel
dependen yang dapat dijelaskan oleh hubungan linier dengan nilai variabel
2
independen. Nilai koefisien determinansi ini berkisar : 0 R 1

R2 juga dapat digunakan untuk mempertimbangkan sebuah model regresi. Jika


R2

suatu model besar belum tentu model tersebut adalah model yang baik,

tetapi jika MSE model kecil maka model teresbut adalah model regresi yang
terbaik.
Koefisien

determinasi

biasanya

penafsirannya jika 0.994 sehingga

dinyatakan

dengan

persen.

Sedangkan

R2 = 0.989 atau 98.9% adalah pengaruh

variabel bebas terhadap perubahan variabel terikat adalah 98,9%, sedangkan


sisanya sebesar 1,1% dipengaruhi oleh variabel lain selain variabel bebas X.
Koefisien determinasi banyak digunakan dalam penjelasan tambahan untuk hasil
perhitungan koefisien regresi.
6.2.3. Korelasi Ganda
Korelasi ganda adalah korelasi yang menunjukkan arah dan kuatnya hubungan
antara dua atau lebih variabel terikat secara bersama-sama dengan variabel yang
lain (variabel bebas). Contohnya:

hubungan antara kesejahteraan pegawai,

hubungan dengan pemimpin, dan pengawasan dengan efektivitas kerja.


Korelasi berganda merupakan korelasi dari beberapa variabel bebas secara

X 1 , X 2 ,..., X k
serentak dengan variabel terikat. Misalkan ada k variabel bebas,
dan satu variabel terikat Y dalam suatu persamaan regresi linear maka besarnya
korelasi bergandanya adalah :
r y , x , , x =
1

a 1 x 1 y + a2 x 2 y+ +a k x k y

dengan

y2

x 1 y = X 1 Y
x k y= X k Y

X1 Y
n

Xk Y
n
2

y = Y

( Y )
n

6.2.4. Korelasi Parsial


Korelasi parsial adalah korelasi yang menunjukkan arah dan kuatnya hubungan
atau pengaruh antara dua variabel atau lebih (variabel bebas dan terikat) setelah
satu variabel yang diduga dapat mempengaruhi hubungan variabel tersebut
dikendalikan untuk dibuat tetap keberadaannya.
Persamaan korelasi antara x1 dengan y, bila variabel x1 dikendalikan atau korelasi

ryx
1

antara x1 dengan y bila x2 tetap yaitu :


r
( y x 2 r x x )
1

(1r
r y, x

2
x1 x2

, x2

) (1r 2y x )
2

Dimana :
ry,x ,x
1

ryx
ryx

rx

x2

= korelasi antara x1 dengan x2 secara bersama-sama dengan variabel y

= korelasi product moment antara x1 dengan y


= korelasi product moment antara x2 dengan y
= korelasi product moment antara x1 dengan x2

6.3. Uji Hipotesis Korelasi


Pengujian hipotesis korelasi bertujuan untuk mengetahui apakah terdapat
hubungan antara dua variabel tertentu.

Perumusan hipotesis untuk korelasi adalah sebagai berikut:


H0: Tidak ada hubungan linier yang signifikan antara dua variabel

H1: Ada hubungan linier yang signifikan antara dua variabel


Atau

H0

:=0

H1
:0
Statistik uji:

hitung

b
S

SSR
S

xx

Statistik uji menggunakan uji-T, yakni dengan

menggunakan rumus sebagai


t hitung =

r n2
1r 2

berikut:

atau

t tabel =t

( ;df )
2

dimana df =n2

Kriteria uji
Tolak H0 jika thitung > ttabel atau thitung < -ttabel
Kesimpulan
Sementara untuk menguji hipotesis koefisien korelasi dengan menggunakan
koefisien korelasi taksiran (

H 0 : =0

dimana

, dapat digunakan hipotesis sebagai berikut:

0 0

H 1 : 0

z hitung =

Statistik uji:

z tabel=z

(uji satu sisi) atau

(1+r ) ( 10 )
n3
ln
2
( 1r ) ( 1+ 0 )

z tabel=z
2

Kriteria uji:
Tolak H0 jika zhitung > ztabel atau zhitung < -ztabel

(uji dua sisi)

Kesimpulan

6.4.Analisis Regresi
Dalam kehidupan sehari-hari, seringkali dijumpai kasus yang berhubungan dengan dua
variabel atau lebih. Hubungan tersebut dapat berupa hubungan kausal atau hubungan
fungsional. Hubungan kausal misalnya : hubungan antara panas dengan tingkat muai
panjang, sedangkan hubungan fungsional contohnya: hubungan antara kepemimpinan
dengan tingkat kepuasan kerja pegawai.
Secara umum terdapat dua macam hubungan antara dua variabel atau lebih, yaitu :
Keeratan hubungan dapat diketahui dengan analisis korelasi (bukan hubungan sebabakibat)
Bentuk hubungan dapat diketahui dengan analisis regresi
6.4.1. Sejarah Regresi
Sejarah Regresi dimulai ketika Sir Francis Galton (1822-1911) yang membandingkan
tinggi badan anak laki-laki dengan tinggi badan ayahnya. Galton menunjukkan bahwa
tinggi anak laki-laki dari ayah yang tinggi setelah beberapa generasi cenderung mundur
(regressed) mendekati nilai populasi. Dengan kata lain, anak laki- laki dari ayah yang
badannya sangat tinggi, cenderung lebih pendek dari ayahnya. Sedangkan anak laki-laki
dari ayah yang badannya sangat pendek cenderung lebih tinggi dari ayahnya. Sekarang
istilah regresi diterapkan pada semua peramalan.
6.4.2. Definisi Regresi
Regresi merupakan salah satu metoda dalam analisis statistika yang digunakan untuk
menganalisis dan memodelkan secara matematis hubungan diantara dua variabel atau
lebih. Pada analisis regresi ini dikenal adanya variabel dependen (variabel tak
bebas/variabel

tergantung/Unknown

independen (variabel
Variabls/).

bebas/

Variable/Response

Variable)

dan

variabel

Explanatory Variable/Regressor Variable/Predictor

Regresi dipakai untuk mengukur besarnya pengaruh perubahan pada

variabel dependen yang diakibatkan perubahan pada variabel independen.


Menurut Gujarati (2006) analisis regresi merupakan suatu kajian terhadap hubungan
satu variabel yang disebut sebagai variabel yang diterangkan (the explained variabel)
dengan satu atau dua variabel yang menerangkan (the explanatory). Variabel pertama

disebut juga sebagai variabel tergantung dan variabel kedua disebut juga sebagai
variabel bebas. Jika variabel bebas lebih dari satu, maka analisis regresi disebut regresi
linear berganda. Disebut berganda karena pengaruh beberapa variabel bebas akan
dikenakan kepada variabel tergantung. Saat ini, analisis regresi banyak digunakan untuk
menelaah hubungan dua variabel atau lebih dan menentukan pola hubungan yang
modelnya belum diketahui, sehingga regresi secara aplikatif lebih bersifat eksploratif.

6.4.3. Asumsi
Penggunaan regresi linear sederhana didasarkan pada asumsi diantaranya sbb:

Error () independen secara statistik


Distribusi probabilitas dari Error berdistribusi Normal
Distribusi probabilitas dari Error(*) mempunyai variansi yang konstan
Ada hubungan linier antara kedua variabel

Catatan (*):

Residual adalah selisih antara nilai duga (predicted value) dengan nilai pengamatan

sebenarnya apabila data yang digunakan adalah data sampel.


Error adalah selisih antara nilai duga (predicted value) dengan nilai pengamatan yang

sebenarnya apabila data yang digunakan adalah data populasi.


Persamaan keduanya : merupakan selisih antara nilai duga (predicted value) dengan

pengamatan sebenarnya.
Perbedaan keduanya: residual dari data sampel, error dari data populasi.

6.4.5. Analisis Regresi Linier Sederhana


y x
Regresi linier sederhana ini bertujuan untuk mempelajari hubungan
antara dua variabel yaitu satu variabel bebas/variabel independen (X) dan variabel
terikat/variabel dependen (Y). Bentuk umum dari pesamaan regresi linier sederhana dari
populasi adalah:
yi a bx

Persamaan garis regresi sampel memberikan estimasi garis regresi populasi

sebagai berikut:

Keterangan :
^
yi
= nilai estimasi dari variabel bebas. juga merupakan variabel terikat (dependen
variable)
a = konstanta yang merupan nilai estimasi

^y

jika nilai x=0 (intercept)

b = koefisien regresi/gradient garis regresi (slope)


x = variabel bebas (independent variable)

6.4.5.1.

Metode Kuadarat Terkecil (Least-Squares Method)


Metode untuk menaksir dan sehingga jumlah kuadrat dari deviasi simpangan antara
observassi-observasin dan garis regresi menjadi minimum:
i ^y
y

e2i =
i=1

SSE=L=
i =1

Dimana adalah nilai sisaan/galat/error yang merupakan penyimpangan model regresi


dari nilai yang sebenaranya.

Gambar VI.2 Grafik Regresi Linier dengan Nilai

Dengan cara mendeferensialkan persamaan di atas terhadap dan kemudian terhadap ,


kemudian menyamakan hasil pendeferensilan itu dengan nol, maka:

x ix
(Y iab ())=0
n

L
=2
a
i=1

Dari persamaan di atas, maka diperoleh persamaan:


( x x )( y y )
b
S
b= xy
( x x )2
S xx
atau
atau

n xy x y

n x 2 x

atau
Dari persamaan di atas disubstitusi, maka diperoleh persamaan untuk menentukan nilai
n

a: a =

yi

xi

i=1

b i=1
n
n

atau:
a=
Dimana:

b x

= rata rata yi

x = rata rata x
i
6.4.5.2.

Partisi dari Varians Total


Estimasi parameter

menghasilkan variansi yang disebabkan karena kesalahan

model dan variansi yang disebabkan karena kesalahan eksperimen. Dekomposisi varians
dapat dijabarkan sebagai berikut:
SST = SSR + SSE
Keterangan:
SST = Sum of Square Total / Jumlah Kuadrat Total =

S yy

SSR = Sum of Square Regression / Jumlah Kuadrat Regresi = b


SSE = Sum of Square Eror / Jumlah Kuadrat Eror =

S yy

S xy
S xy

Dimana :

S xx = x i2n x 2
S yy = y i2n y 2
S xy = x i y in x y

2
6.4.5.3. Estimasi dari

Sum of Square Error (SSE) merupakan variansi yang menggambarkan penyimpangan


dari nilainilai observasi di sekitar garis regresi sampel. Nilai SSE (
biasa disebut MSE (Mean Squared Error) adalah estimasi dari

Se

) atau yang

dan diestimasi

dengan persamaan berikut:


Se

=S=

( y ^y )2
n2

SSE
n2

S yyb S xy
n2

Standar Error Koefisien Regresi


Jika diambil sampel x dan y dari populasi, maka masingmasing sampel tersebut
memiliki gradien/slope (b) sendiri. Gradien sampel tersebut akan bervariasi disekitar
nilai koefisien regresi tersebut. Maka perlu diketahui variasi koefisien regresi tersebut
dengan persamaan berikut:

sb

6.4.5.3.

S xx

(x x) 2

Standar Error untuk

s
( x) 2
x
n
2

bila nilai x diketahui

Jika nilai x dimasukkan berulangulang pada persamaan regresi, maka nilai ratarata
yang diperoleh tidak akan sama, yang artinya nilai
standar error

S y

bervariasi. Sehingga nilai

dapat ditentukan dengan persamaan berikut (bila x diketahui):

= Se

( (

2
1 ( x 0 x )
+
n
S xx

))

6.4.6.Uji Parsial Parameter Regresi


Digunakan untuk menguji apakah parameter berarti pada model secara parsial.
Tahapan uji yang dilakukan:
Hipotesis:
H0 : = 0
H1 : 0
Statistik Uji:
b 0 b 0
t=
=
Sb
s / S xx
Pengambilan Keputusan:
Tolak H0 jika thitung > t a/2(df= n-2) pada selang kepercayaan
Kesimpulan

6.4.7. Uji Intersep Model Regresi


Tahapan uji yang dilakukan:

Hipotesis:
H0 : = 0
H1 : 0
Statistik Uji:
a
t=
s

xi
n S xx

Pengambilan Keputusan
Tolak H0 jika thitung > t a/2(db= n-2) pada selang kepercayaan
Kesimpulan
6.4.8. Selang Kepercayaan
Selang Kepercayaan untuk :

a t/2

xi

nS xx

Selang Kepercayaan untuk :

b t/2s b

6.4.9.Prediksi
Estimasi selang keyakinan untuk Rata-rata y, diberikan pada saat xp

y t/2s

2
1 (x p x)

n (x x) 2

Estimasi selang keyakinan untuk Nilai individual y diberikan pada saat xp

y t/2s

2
1 (x p x)
1
n (x x) 2

6.5. Pemilihan Model Regresi


Penentuan model regresi linier sederhana ditekankan pada konsep linieritasnya
dengan asumsi awal bahwa hubungan tersebut linier diparamater regresinya.
Pemilihan variabel independen yang kurang tepat dapat menimbulkan bias dalam
estimasinya.
Tahapan uji yang dilakukan:
Hipotesis
H0 : = 0
H1 : 0
Tentukan daerah kritis dengan Level of Significance () yang biasa digunakan
adalah 0,01 atau 0,05
Tabel VI.1 Analysis of Variance
Sumber
Variansi
Regresi
Error
Total

SS

df

SSR
SSE
SST

1
n2
n1

MS
MSR = SSR/1
S2 = SSE/n-2

Fhitung
MSR/s2

Pengambilan Keputusan
Tolak H0 jika Fhitung > Ftabel(1 , n-2) pada selang kepercayaan (level of significance)
Kesimpulan

6.5.1 Pendekatan Analisis Varians (Anova)


Untuk menguji kelayakan dari suatu model regresi digunakan pendekatan analisis
varians.Analisis varians adaah suatu prosedur membagi variansi total variabel dependen
menjadi dua komponen, yaitu: variansi model sistematik dan variansi error.

6.6.

Analisis Residual
Analisis residual dapat dilakukan dengan:

a. Pengujian Unequal variances: Varians pada setiap nilai x harus identik, yaitudengan
melakukan plot

e^i

dengan

^y , apabila terdapat pola-pola tertentu berarti

varians tidak identik sehingga perlu distabilkan dengan transformasi.

b. Pengujian Non normal error,yaitu dengan:


Stem and leaf
Histogram
Dot diagram
Plot normal (Normal Probability Plot)
c. Jika terdapat extreme skewness (kemiringan yang ekstrim) pada data, maka tidak
berdistribusi normal.
d. Pengujian Correlated Error (independent), yaitu dengan melihat plot

e^i

dengan

time order (i). Jika ada pola tertentu, maka terjadilah dependent residual dimana
penyebabnya

dapat

karena

kesalahan

eksperimen

atau

kesalahan

dalam

pembentukan model atau karena variabel prediktor yang diabaikan.


e. Pengecekan Ouliers residual yaitu dengan cara plot residual dalam batas pengujian
3 (

plot e^i

dengan

^y ).Apabila residual terletak di luar batas 3 atau nilainya

lebih besar dari 3, maka ada indikasi outlier.

6.7.

Pengujian Linieritas Regresi:untuk data dengan observasi berulang


Pada beberapa percobaan untuk mendapatkan hasil yang akurat seringkali dilakukan
pengulangan observasi untuk setiap nilai x, sehingga perlu dilakukan pengujian apakah

model yang dihasilkan sudah memenuhi atau tidak. Untuk menggambarkan kondisi
tersebut diatas dilakukan pengujian kecocokan model dengan pendekatan Lack Of Fit.

6.7.1. Pengujian Lack Of Fit


Sum of squared error terdiri atas dua komponen, yaitu variasi random yang
muncul antar nilai y untuk setiap nilai x (pure experimental error) dan komponen yang
dikenal dengan istilah Lack Of Fit (LoF), untuk mengukur ketepatan model.
Prosedur Pengujian:

Hipotesis
H0 : Tidak ada LoF
H1 : Ada LoF Model Linier tidak sesuai
Tentukan daerah kritis dengan Level of Significance () yang biasa digunakan adalah

0,01 atau 0,05

Hitung Pure Error sum of square ( SSpe )

yi .
y ij

dengan df = n k

i=1

SS pe =
i=1

Tabel VI.2 Analysis of Variance


Sumber
Variansi
Regres
i
Error:

SS
SSR

df
1

SSE

n
2

MS

Fhitung

MSR = SSR/1

MSR/s2

S2 = SSE(/n-2)

Lof

SSE

Pure error

- k-2

SSpe

SSpe /( k2)

SSpe
Total

(SSE

n-k

SST

S2= SSpe

SSESSpe
S2 (k2)

/(n-k)

Pengambilan Keputusan

Tolak H0 jika Fhitung > Ftabel(k-2 , n-k) pada selang kepercayaan (level of significance)

Kesimpulan

Contoh 1
nilai 9 mahasiswa dari suatu kelas pada ujian tengah semester (x) dan pada ujian akhir
semester (y) sebagai berikut :
n
xi
yi

1
77
82

2
50
66

3
71
78

4
72
34

5
81
47

6
94
85

7
96
99

8
99
99

9
67
68

a. Tentukan persamaan garis regresi linear.


b. Tentukan nilai ujian akhir seorang murid yang mendapat nilai 85 pada ujian tengah
semester.
Jawab :
persamaan regresi linear
n
xi
yi
xiyi
xi2

1
77
82
631
4
592
9

Sehingga b =

dan

2
50
66
330
0
250
0

3
71
78
5538

4
72
34
2448

5
81
47
3807

6
94
85
7990

7
96
99
9504

8
99
99
9801

9
67
68
4556

707
658
53258

5041

5184

6561

8836

9216

9801

4489

57557

( 9 )( 53.258 ) ( 707 ) (658)


( 9 ) ( 57.557 )(707)2

= 0,777142

a=

658( 0,777142 ) (707)


9

= 12,06232

jadi, persamaan regresi linear adalah


^y = 12,06232 + 0,777142x
x = 85
^y

= 12,06232 + (0,777142)(85) = 78,11936

Contoh 2
Lakukan uji regresi dengan pendekatan ANOVA pada :
x 3,4
y 25

2,8
20

2,5
18

3,7
25

3,2
21

3,1
22

2,9
30

3
22

2,2
10

2,4
20

Jawab :
x = 31,9
y = 230
xiyi = 675,5
xi2 = 94,49
yi2 = 4866
x = 2,9
y = 20,9091
b = 0,777142
a = 12,06232

Sxx = xi2 n( x )2 = 1,98


Sxy = x y n( x y )= 8,4997
i i

Syy = yi2 n( y )2 = 56,9049


SSR = b2 Sxx = 36,4894
SSE = Syy SSR = 20,4155
Hipotesis
H0 : = 0
H1 : 0
= 0.05
Tabel Anaysis of Variance
KomponenRe

SS

df

MS

Fhitung

gresi
Regresi

36,4

36,49

16,08

2
7
6

2,7
17

Error

20,4

Total

56,9

2,27

2
10
0
4
9
Pengambilan Keputusan
F tabel = F(0.05;1,9) = 5,12
Karena Fhitung > Ftabel maka Ho ditolak
Kesimpulan:Model Regresi linier sesuai

Contoh 3
Berikut adalah data jumlah biaya promosi (x) dan jumlah penjualan (y) pada perusahaan
ABC.
Tahun

Jumlah Biaya Promosi x)

Jumlah Penjualan (y)

2005

22

30

2006

36

38

2007

31

35

2008

32

37

2009

31

34

2010

32

38

Tentukanlah apakah terdapat hubungan antara biaya promosi dengan penjualan


menggunakan uji korelasi Spearman Rank dan tingkat kesalahan 1%!
Jawab:
Tahun

Jumlah

Jumlah

Range

Range

Biaya

Penjuala

d i=R ( x )R( y )

di

Promos
i (x)

n (y)

2005

22

30

2006

36

38

5.5

0.5

0.25

2007

31

35

2.5

-0.5

0.25

2008

32

37

4.5

0.5

0.25

2009

31

34

2.5

0.5

0.25

2010

32

38

4.5

5.5

-1

r s =1

6(2)
12
=1
=10 , 057=0 , 943
2
210
6(6 1)

Uji Hipotesis:
H0 : Tidak ada hubungan yang signifikan antara variabel biaya promosi dengan variabel
penjualan
H1 : Ada hubungan yang signifikan antara variabel biaya promosi dengan variabel
penjualan.
Statistika uji:
r n2 ( 0 , 943 ) 62
1 ,886
t hitung = 2 =
=
=17 ,03
2
0 , 11075
1r
1( 0 , 943 )
t tabel =t

=4 , 604

(0 ,201 ; 4)

Kriteria uji: Karena thitung > ttabel maka tolak H0


Kesimpulan: Karena tolak H0 maka terima H1 yakni ada hubungan yang signifikan antara
variabel biaya promosi dengan variabel penjualan

LATIHAN SOAL:

1. Data berikut menyatakan IQ=X untuk kelompok anak berumur tertentu dan hasil ujian
prestasi pengetahuan umum (Y).

Xi

Yi

Xi

Yi

Yi

Yi

114
110
113
137
116
132
90
121
107
120
125
92

29
41
48
73
55
80
40
75
43
64
53
31

130
142
137
140
125
134
106
121
111
126
95
105

71
68
69
66
39
78
49
59
66
67
46
47

96
89
105
125
107
97
134
106
99
98
117
100

45
32
50
57
59
48
55
45
47
59
47
49

a.
b.
c.
d.
e.

Gambar diagram pencarnya.


Tentukn regresi linear Y atas X lalu gambarkan.
Jelaskan arti koefisien arah yang didapat.
Berapa rata-rata prestasi anak dapat diharapkan jika IQ nya 120?
Tentukan interval kepercayaan 95% untuk rata-rata prestasi anak dengan IQ=120.

f.

Jelaskan artinya!
Tentukan interval kepercayaan 95% untuk seorang anak dengan IQ=120. Jelaskan

g.

artinya!
Tentukan interval kepercayaan 95% untuk perubahan rata-rata prestasi jika IQ berubah

h.
i.

dengan satu unit.


Perlukah diambil model berbentuk lain?
Asumsi apakah yang harus diambil untuk menyelesaikan pertanyaan-pertanyaan diatas?

2. Dari tabel berikut ini:


X (oC)

Y (gram)

0
8
6
8
15
12
10
14
30
25
21
24
45
31
33
28
60
44
39
42
75
48
51
44
Carilah persamaan garis regresi
Gambarkan garis tersebut pada diagram pencar
Taksirlah banyaknya senyawa yang larut dalam 100 g air pada 50oC.

3. Lakukan uji model regresi pada soal no.1.

4. Berikut adalah data banyaknya modal (dalam juta rupiah) dan keuntungan yang diperoleh
(dalam juta rupiah) yang dihasilkan dalam waktu 10 bulan.

Modal (x)
Keuntungan

189
10

204
15

192
13

214
17

218
19

178
14

189
13

167
11

180
13

194
15

(y)
a. Hitunglah koefisien korelasi Pearson dan determinasi berdasarkan data di atas dan ujiah!
b. Tentukan apakah pernyataan bahwa koefisien korelasi antara jumlah karyawan dan
keuntungan tidak lebih dari 0,7 adalah benar! Gunakan tingkat kesalahan 5%!

5.

Hitunglah koefisien korelasi kondisi temperatur (x) dan kepuasan pekerja (y) serta
apakah
ada hubungan yang signifikan antara keduanya dengan menggunakan teknik korelasi
pearson!

Kondisi

temperatur

KepuasanKerja

(x)

(y)

20

12

20

10

17

18

19

20

12

18

10

19

12

16

10

17

11

10

16

12

12

17

13

12

18

14

12

12

15

12

17

6. Dibawah ini diberikan data yang secara acak diambil dari populasi normal bervariabel
dua (X dan Y).

15
13
10
11
16
12
9
12
4
8

108
106
99
110
135
97
74
98
20.
69

8
11
17
20
12
18
16
13
18
11

56
75
137
163
84
149
140
137
170
109

17
6
8
5
3
6
14
5
15
16

153
73
95
26
24
50
96
35
132
141

I.1.1

Regresi Linier Berganda


Analisis regresi linier berganda digunakan untuk menganalisis hubungan antara variabel

bebas (x) dan variabel terikat (y). Namun pada regresi linier berganda ini, variabel bebas (x)
yang digunakan lebih dari dari satu. Bentuk persamaan umum untuk model regresi linier
berganda:
^y = a + b1 x1 +b 2 x 2 + +b n x n
Keterangan:
^y = nilai dari variabel terikat
a

= konstata nilai estimasi


bi

^y

jika nilai x=0 (intercept)

= koefisien regresi gradient garis regresi (slope)

x n = variabel bebas
I.1.1.1 Metode Kuadarat Terkecil (Least-Squares Method)
( x 1i , x 2i ; y i ) ;i =1,2, , n
Untuk setiap pengamatan
akan memenuhi persamaan:
{ }
^y = a + b1 x1 +b 2 x 2 + +b n x n +e i

Dengan menggunakan metode kuadrat terkecil, maka diperoleh persamaan:


ei
b x b x bn x n
= ^y - a - 1 1 2 2
Dengan syarat meminimasikan nilai a,

b1

, dan

b2

penurunannya, maka diperoleh

persamaan:

yi

x i1 + b1 x i2
= an + b1
i=1
i=1

x1 i yi
i=1
n

x2 i yi
i=1

x i1 x i2
+ b2
i=1

x 2 i + b2 x i2
=a
i=1
i=1

x i1 x 2i
+ b1
i=1

i=1
n

x
+ b1
i=1

2
i1

=a

x1 i

Asumsi yang digunakan dalam analisis regresi linier berganda antara lain:
a. Setiap nilai error berdistribusi normal dengan ratarata 0 dan dan varians 2

b. Bersifat homoskedastisitas
c. Kovarian error = 0, tidak terjadi autokorelasi
d. Tidak terdapat multikolinieritas, artinya tidak terdapat hubungan linier yang sempurna
diantara variabelvariabel bebas.
Latihan soal
1. Dari tabel berikut ini:
X (oC)

Y (gram)

0
8
6
8
15
12
10
14
30
25
21
24
45
31
33
28
60
44
39
42
75
48
51
44
a. Carilah persamaan garis regresi
b. Gambarkan garis tersebut pada diagram pencar
c. Taksirlah banyaknya senyawa yang larut dalam 100 g air pada 50oC.
2. Lakukan uji model regresi pada soal no.1.

You might also like