You are on page 1of 28

ANALISIS DATA MEDIS INFERENSIAL

TUGAS
UJI REGRESI LINIER DAN UJI REGRESI LOGISTIK

Oleh :
Rizky Wulan Indryanti
G41140633
B / 24

PROGRAM STUDI DIV REKAM MEDIK


JURUSAN KESEHATAN
POLITEKNIK NEGERI JEMBER
2016
UJI REGRESI LINIER

1. Buat hipotesis statistik


a) Ho = Tidak ada pengaruh tinggi badan dan umur terhadap berat
badan.
b) Ha = Ada pengaruh tinggi badan dan umur terhadap berat
badan.
2. Tentukan nilai = 0,05
3. Buka program SPSS

4. Klik variabel view pada SPSS

5. Kemudian pada kolom name ketik variabel yang akan dilakukan pengujian,
misalkan menguji Umur, Tinggi Badan, dan Berat Badan.

6. Kemudian Klik data view, masukkan nilai dari variabel yang akan dilakukan
pengujian.

7. Klik analyze Regression Linier


8. Kemudian masukkan variabel Berat_Badan pada Dependent dan variabel
Umur serta Tinggi_Badan pada Independent.

9. Klik statistics.
10. Kemudian pada Regression Coefficients centang/cawang pada pilihan
Estimates, centang/cawang pilihan Model fit dan Collinearity diagnostics,
serta pada Residuals centang/cawang pada Durbin-Watson. Setelah itu klik
Continue.

11. Klik Plots.

12. Kemudian pada scatter 1 of 1 masukkan *SPRESID pada kolom Y dan


*ZPRED pada kolom X. Setelah itu pada Standardized Residual Plots centang
Histogram dan Normal probability plot. Klik Continue.
13. Klik Save.

14. Kemudian beri tanda centang Unstandardized pada Residuals. Klik


Continue.
15. Klik OK. Maka hasilnya akan terlihat.

16. Output :

A B C D

Penjelasan :
a. Dari output model summary di atas terlihat bahwa nilai R
(koefisien korelasi) sebesar 0.740 yang berarti bahwa variabel
dependent dan independent dapat dikategorikan memiliki
hubungan liniear yang sangat kuat.
b. Berdasarkan gambar diperoleh angka adjusted R Square sebesar
0.448 atau 44.8%. Hal ini menunjukkan bahwa tinggi badan dan
umur berpengaruh sebesar 44.8% terhadap berat badan sedangkan
sisanya sebesar 55.2% (100% - 44.8%) dipengaruhi oleh variabel
atau faktor lain diluar penelitian.
c. Std. Error of the Estimate (SEE) sebesar 5,437. makin kecil nilai
SEE akan membuat model regresi semakin tepat dalam
memprediksi variabel dependent.
d. Nilai Durbin-Watson yang tertera pada output SPSS disebut
dengan Durbin-Watson hitung. Angka ini akan dibandingkan
dengan kriteria penerimaan atau penolakan yang akan dibuat
dengan nilai dL dan dU ditentukan berdasarkan jumlah variabel
bebas dalam model regresi (k) dan jumlah sampelnya (n). Nilai dL
dan dU dapat dilihat pada Tabel Durbin-Watson dengan tingakat
signifikansi (error) 5% ( = 0.05).
Jumlah variabel bebas : k = 2
Jumlah sampel : n = 12
Tabel Durbin-Watson menunjukkan bahwa nilai dL = 0,8122
dan nilai dU = 1,5794 sehingga dapat ditentukan kriteria terjadi
atau tidaknya autokorelasi seperti terlihat pada Tabel Durbin-
Watson.
Nilai Durbin-Watson hitung sebesar 1,133 lebih kecil dari
1,5794 dan lebih besar dari 0.8122 yang artinya berada pada
daerah ragu-ragu. Sehingga dapat disimpulkan bahwa dalam
model regresi linier tidak terjadi autokorelasi.

Penjelasan :
Nilai prob. F hitung (sig) pada tabel di atas nilainya 0,028 lebih kecil
dari tigkat signifikasnsi 0,05 sehingga dapat disimpulkan bahwa
model regresi linier yang diestimasi layak digunkana untuk
menjelaskan pengaruh tinggi badan dan umur terhadap berat badan.

Penjelasan :
a. Nilai prob. t hitung dari variabel bebas umur sebesar 0,800
yang lebih besar dari 0,05 sehingga variabel bebas umur tidak
berpengaruh signifikan terhadap berat badan dengan derajat
keyakinan 95%.
b. Nilai prob. t hitung dari variabel bebas tinggi badan sebesar
1,609 yang lebih besar dari 0,05 sehingga variabel bebas
tinggi badan tidak berpengaruh signifikan terhadap variabel
terikat berat badan pada 5% atau dengan kata lain, tinggi
badan tidak berpengaruh signifikan terhadap berat badan
dengan derajat keyakinan 95%.
Persamaan Regresi :

Y = b0 + b1X1 + b2X2
Y = 12,022 + 0,400X1 + 0,259X2

Keterangan :
Y = Berat Badan yang Diprediksi
b0 = Konstanta (Constant)
b1 & b2 = Koefisien Regresi
X1 = Umur
X2 = Tinggi Badan
CHART
Sebaran titik-titik dari gambar Normal P-P Plot di atas relatif
mendekati garis lurus, sehingga dapat disimpulkan bahwa (data)
residual terdistribusi normal. Hasil ini sejalan dengan asumsi klasik
dari regresi linier dengan pendekatan OLS.
Kelemahan dari uji normalitas dengan Normal P-P Plot terletak
pada kriteria dekat/jauhnya sebaran titik-titik. Tidak ada batasan yang
jelas mengenai dekat atau jauhnya sebaran titik-titik tersebut sehingga
sangat dimungkinkan terjadi kesalahan penarikan kesimpulan.
Misalnya teramati bahwa sebaran titik-titik terlihat relatif dekat
(artinya terdistribusi normal), tapi ternyata tidak cukup dikatakan
dekat (tidak terdistribusi normal). Kondisi ini akhirnya bergantung
kepada subjektifitas pengamat (orang yang melihat).
Dari gambar di atas terlihat bahwa sebaran titik tidak membentuk
suatu pola/alur tertentu, sehingga dapat disimpulkan tidak terjadi
heterokedastisitas atau dengan kata lain terjadi homoskedastisitas.
Asumsi klasik tentang heteroskedastisitas dalam model ini terpenuhi,
yaitu terbebas dari heteroskedastisitas.
Uji ini (scatterplot) rentan kesalahan dalam penarikan
kesimpulannya. Hal ini dikarenakan penentuan ada tidaknya pola/alur
atas titik-titik yang ada di gambar sangat bersifat subjektif. Bisa saja
sebagian orang mengatakan tidak ada pola, tapi sebagian lainnya
engatakan ini ada polanya. Tidak ada ukuran yang pasti kapan suatu
scatterplot membentuk pola atau tidak. Keputusan hanya
mengandalkan pengamatan/penglihatan peneliti.
UJI REGRESI LOGISTIK

1. Buat hipotesis statistik


c) Ho = Tidak ada pengaruh kejadian kanker pulmo (CA Pulmo)
dengan kebiasaan merokok, usia, riwayat keluarga CA Pulmo, dan
daerah asal tinggal.
d) Ha = Ada pengaruh kejadian kanker pulmo (CA Pulmo) dengan
kebiasaan merokok, usia, riwayat keluarga CA Pulmo, dan daerah asal
tinggal.
2. Tentukan nilai = 0,05
3. Buka program SPSS

4. Klik variabel view pada SPSS

5. Kemudian pada kolom name ketik variabel yang akan dilakukan pengujian,
misalkan menguji ca_pulmo, perokok, usia, riwayat_keluarga, daerah,
PRE_1, PGR_1, RES_1, dan SRE_1.

6. Kemudian pada kolom label ketik label sesuai kriteria variabel. Seperti
berikut:

7. Kemudian pada kolom values, ubah value label sesuai kategori masing-
masing variabel. Seperti berikut :
ca_pulmo :
perokok :

riwayat_keluarga :

daerah :
PGR_1 :

8. Kemudian Klik data view, masukkan nilai dari variabel yang akan dilakukan
pengujian.
9. Klik analyze regression binary logistic.

10. Masukan variabel ca_pulmo kedalam variabel dependent dan variabel


perokok, usia, riwayat_keluarga serta daerah kedalam variabel covariates.

11. Klik menu save centang probabilitas, group membership, unstandardized dan
studentized. Klik continue.
12. Klik menu options centang semua option yang terdapat di statistics and plots.
Klik continue.
13. Klik OK maka akan muncul hasil outputnya.

14. Output :

Penjelasan :
Di atas pada tabel Case Processing Summary adalah ringkasan
jumlah sampel, yaitu sebanyak 30 sampel.
Penjelasan :
Di atas adalah kode variabel dependent. Yaitu kategori Tidak CA
Pulmo dengan kode 0 dan CA Pulmo dengan kode 1. Oleh karena
yang diberi kode 1 adalah CA Pulmo, maka CA Pulmo menjadi
referensi atau efek dari sebab. Sebab yang dimaksud adalah kejadian
yang dihipotesiskan sebagai penyebab munculnya efek atau masalah.
Dalam hal ini, perkok (kode 1), usia, riwayat keluarga (kode 1),
daerah (kode 1) menjadi sebab yang dapat meningkatkan resiko
terjadinya CA Pulmo (kode 1).

Penjelasan :
a. Tabel Iteration History pada block 0 atau saat variabel
independent tidak dimasukkan dalam model : N=30
mendapatkan Nilai -2 Log likelihood = 41,455.
b. Degree of Freedom (DF) = N 1 = 30 1 = 29. Chi-Square (X2)
tabel pada DF 29 dan probabilitas 0,05 = 42,557.
c. Nilai -2 Log likehood (41,455) < X2 tabel (42,557) Ha
ditolak, maka Ho diterima menunjukkan bahwa model
sebelum memasukkan variabel independent adalah FIT dengan
data.
Penjelasan :
Di atas pada tabel Classification Table merupakan tabel kontingensi 2
x 2 yang seharusnya terjadi atau disebut juga frekuensi harapan
berdasarkan data empiris variabel dependent referensi atau akibat
buruk (kode 1) yaitu CA Pulmo sebanyak 16 orang. Sedangkan yang
Tidak CA Pulmo sebanyak 14 orang. Jumlah sampel sebanayk 30
orang. Sehingga nilai overall percentage sebelum variabel
independent dimasukkan ke dalam model sebesar :
16
=0,53 x 100 =53,3
30

Penjelasan :
a. Tabel Variabel in The Equation saat sebelum variabel
independent di masukkan ke dalam model, maka belum ada
variabel independent di dalam model. Nilai Slope atau
Koefisien Beta () dari konstanta adalah sebesar 0,134 dengan
Odds Ratio atau Exp(B) sebesar 1,143. Nilai signifikansi atau
p value dari Uji Wald sebesar 0,715.
b. Perlu diingat bahwa nilai B identik dengan koefisien beta pada
Ordinary Least Square (OLS) atau regresi liniear. Sedangkan
Uji Walt identik dengan t parsial pada OLS. Sedangkan Exp(B)
adalah nilai eksponen dari B, maka Exp(0,134) = 1,143.

Penjelasan :
Di atas pada tabel Variables not in the Equation menunjukkan
variabel yang belum dimasukkan ke dalam model regresi, yaitu
variabel pokok, usia, riwayat_keluarga, dan daerah.

Penjelasan :
a. Tabel Iteration History Block 1 atau saat variabel independent
dimasukkan dalam model : N = 30. Degree of Freedom (DF)
= N Jumlah variabel independent 1 = 30 4 1 = 25,
Chi-Square (X2) Tabel pada DF 25 dan Prob 0,05 = 37,652.
b. Nilai -2 Log Likelihood (13,496) < X2 tabel (37,652) Ha
ditolak, maka Ho diterima menunjukkan bahwa model
dengan memasukkan variabel independent adalah FIT dengan
data. Hal ini sama dengan Block Beginning di atas, dimana saat
sebelum variabel independent dimasukkan ke dalam model,
model FIT dengan data.

Penjelasan :
a. Tampak di atas bahwa selisihnya (-2 Log likelihood sebelum
variabel independen masuk model : 41,455 dikurangi -2 Log
Likelihood setelah variabel independent masuk model : 13,496
= 27,969) adalah nilai Chi-Square 27,969.
b. Nilai X2 27,969 > X2 tabel pada DF 4 (jumlah variabel
independen 2) yaitu 9,488 atau dengan signifikansi sebesar
0,000 < 0,05 Ho ditolak, yang menunjukkan bahwa
penambahan variabel independent DAPAT memberikan
pengaruh nyata terhadap model, atau dengan kata lain model
dinyatakan FIT.
c. Sehingga jawaban terhadap hipotesis pengaruh simultan
variabel independen terhadap variabel dependent adalah Ha
diterima dan Ho ditolak atau yang berarti ada pengaruh
signifikan secara simultan perokok, usia, riwayat keluarga, dan
daerah terhadap kejadian CA Pulmo oleh karena nilai p value
Chi-Square sebesar 0,000 di mana < Alpha 0,05 atau nilai
Chi-Square Hitung 27,969 > Chi-Square tabel 9,488.
Penjelasan :
a. Tabel Model Summary untuk melihat kemampuan variabel
independen dalam menjelaskan variabel dependen, digunakan
nilai Cox & Snell R Square dan Nagelkerke R Square. Nilai-
nilai tersebut disebut juga dengan Pseudo R-Square atau jika
pada regresi linear (OLS) lebih dikenal dengan istilah R-
Square.
b. Nilai Nagelkerke R Square sebesar 0,810 dan Cox & Snell R
Square sebesar 0,606 yang menunjukkan bahwa kemampuan
variabel independen dalam menjelaskan variabel dependen
adalah sebesar 0,810 atau 81,0% dan terdapat 100% - 81,0%
= 19,0% faktor lain di luar model yang menjelaskan variabel
dependen.

Penjelasan :
Nilai Chi Square tabel untuk DF 8 (Jumlah variabel independen - 1)
pada taraf signifikansi 0,05 adalah sebesar 15,507. Karena nilai Chi
Square Hosmer and Lemeshow hitung 2,542 < Chi Square table
15,507 atau nilai signifikansi sebesar 0,960 > 0,05) Ha ditolak,
yang menunjukkan bahwa model dapat diterima dan pengujian
hipotesis dapat dilakukan sebab ada perbedaan signifikan antara
model dengan nilai observasinya.
Penjelasan :
a. Berdasarkan tabel Classification Table di atas, jumlah sampel
yang tidak mengalami CA Pulmo 13 + 1 = 14 orang. Yang
benar-benar tidak mengalami CA Pulmo sebanyak 13 orang
dan yang seharusnya tidak mengalami CA Pulmo namun
mengalami, sebanyak 1 orang. Jumlah sampel yang mengalami
CA Pulmo 1 + 15 = 16 orang. Yang benar-benar mengalami
CA Pulmo sebanyak 15 orang dan yang seharusnya mengalami
CA Pulmo namun tidak mengalami, sebanyak 1 orang.
b. Tabel di atas memberikan nilai overall percentage sebesar
(13+15)/30 = 93,3% yang berarti ketepatan model penelitian
ini adalah sebesar 93,3%.
Penjelasan :
Lihat tabel Variabel in the Equation di atas semua variabel independen
nilai P value uji wald (Sig) < 0,05, artinya masing-masing variabel
mempunyai pengaruh parsial yang signifikan terhadap Y di dalam
model.
a. Perokok mempunyai nilai Sig Wald 0,245 > 0,05 Ha
ditolak atau yang berarti perokok tidak memberikan pengaruh
parsial yang signifikan terhadap kejadian CA Pulmo.
b. Usia mempunyai nilai Sig Wald 0,008 < 0,05 Ho
ditolak atau yang berarti usia memberikan pengaruh parsial
yang signifikan terhadap kejadian CA Pulmo.
c. Riwayat keluarga mempunyai nilai Sig Wald 0,090 > 0,05
Ha ditolak atau yang berarti riwayat keluarga tidak
memberikan pengaruh parsial yang signifikan terhadap
kejadian CA Pulmo.
d. Daerah mempunyai nilai Sig Wald 0,109 > 0,05 Ha
ditolak atau yang berarti daerah tidak memberikan pengaruh
parsial yang signifikan terhadap kejadian CA Pulmo.
Besarnya pengaruh ditunjukkan dengan nilai EXP (B) atau
disebut juga ODDS RATIO (OR).

e. Variabel perokok dengan OR 6,603 maka orang yang merokok


(kode 1 variabel independent), lebih beresiko mengalami CA
Pulmo (kode 1 variabel dependent) sebanyak 6,603 kali lipat
dibandingkan orang yang tidak merokok (kode 0 variabel
independent). Nilai B = Logaritma Natural dari 6,603 =
1,888.
Oleh karena nilai B bernilai positif, maka perokok mempunyai
hubungan positif dengan kejadian CA Pulmo.
a. Variabel usia dengan OR 1,184. Nilai B = Logaritma Natural
dari 1,184 = 0,169. Oleh karena nilai B bernilai positif, maka
riwayat keluarga mempunyai hubungan positif dengan
kejadian CA Pulmo.
b. Variabel riwayat keluarga dengan OR 187,824 maka orang
dengan riwayat CA (kode 1 variabel independent), lebih
beresiko mengalami CA Pulmo (kode 1 variabel dependent)
sebanyak 187,824 kali lipat dibandingkan orang yang tidak
memiliki riwayat CA (kode 0 variabel independent). Nilai B =
Logaritma Natural dari 187,824 = 5,336. Oleh karena nilai B
bernilai positif, maka riwayat keluarga mempunyai hubungan
positif dengan kejadian CA Pulmo.
c. Variabel daerah dengan OR 27,393 maka orang yang tinggal
dikota (kode 1 variabel independent), lebih beresiko
mengalami CA Pulmo (kode 1 variabel dependent) sebanyak
27,393 kali lipat dibandingkan orang yang tinggal didesa (kode
0 variabel independent). Nilai B = Logaritma Natural dari
27,393 = 3,310. Oleh karena nilai B bernilai positif, maka
perokok mempunyai hubungan positif dengan kejadian CA
Pulmo.
Berdasarkan nilai-nilai B pada perhitungan di atas, maka
model persamaan yang dibentuk adalah sebagai berikut:
P
ln
1P = -10,295 + 1,888 perokok + 0,169 usia + 5,336

riwayat keluarga + 3,310 daerah.


Atau bisa menggunakan rumus turunan dari persamaan di atas,
yaitu:
exp (10,295+1,888 perokok+ 0,169usia+ 5,336 riwayat kelua
Probabilitas=
1+exp (10,295+1,888 perokok +0,169 usia+ 5,336 riwayat kelu
Grafik Klasifikasi dari Observed Group dan Predicted Probabilities

You might also like