Professional Documents
Culture Documents
6.1 Kekurangcocokan
Model yang baik menangkap kecenderungan umum yang terdapat pada data. Dalam hal
demikian hubungan antara peubah dengan respons yang terdapat pada data telah terwakili dengan
cukup baik dalam model. Gambaran ini dapat dilukiskan sebagai
= () + .
Jadi jika antara model dengan data telah terdapat kecocokan yang baik maka sisa akan
berbentuk acak dan rataan kuadrat sisa merupakan penaksir 2 yang terbias. Sisa berpola acak bila
korelasi antara sisa sama, atau dekat, dengan nol. Salah satu cara yang baik untuk menguji apakah
kecocokan (lebih tepat, ketidakcocokan) antara model dengan data ialah dengan membanding
taksiran 2 yang diperoleh dari rataan kuadrat sisa dengan nilai 2 yang sesungguhnya. Bila rataan
kuadrat sisa/ 2 1 maka antara model dengan data terdapat kecocokan yang baik. Atau, lebih
tepat, tidak terdapat ketidakcocokan antara data dengan model.
Dalam praktek, kendati model sudah cukup baik, sulit mengharapkan pola sisa akan betul-
betul acak, begitupun rattan kuadat sisa dibagi 2 mungkin sedikit lebih besar dari 1. Kita mungkin
harus merasa puas bila keadaan yang kita peroleh tidak terlalu jauh menyimpang dari keadaan
ideal tersebut diatas.
Bila diketahui
( ) 2
= 2
2 2
Bila 2 = rataan kuadrat sisa, n= ukuran terok, dan p = banyaknya parameter dalam model,
termasuk 0. Nilai 2 dengan = . Bila 2 hasil perhitungan lebih besar dari yang
tertera pada tabel untuk = dan taraf keberartian tertentu maka dikatakan
ketidakcocokan berarti pada taraf . Dalam keadaan demikian maka model lain perlu dicari karena
model yang telah diuji tidak mempunyai kecocokan yang baik dengan data.
Umumnya 2 tidaklah diketahui. Hanya dalam keadaan tertentu tersedia nilai 2 dan hal
ini jarang terjadi. Karena itu diperlukan sumber khusus untuk mendapatkan penaksir 2 yang tak
bias dan tidak tergantung pada model. Sumber khusus ini adalah replikasi yang dengan sengaja
dibuat dalam rancangan penelitian.
Replikasi hendaklah dibedakan dengan pengulangan pengukuran (repitisi). Pengukuran
berat seseorang beberapa kali merupakan pengulangan pengukuran dan bertujuan meninggikan
keyakinan akan kebaikan / keburukan pengukuran tersebut. Makin kecil variasi pengukuran makin
yakin akan ketelitian alat/cara pengukuran. Tetapi jika ingin mengaitkan umur (x) dengan berat
badan orang (y) dan kita mengukur berat badan beberapa orang yang sama umurnya maka kita
membuat replikasi pengukuran pada suatu nilai x (umur) yang sama.
Tujuannya ialah untuk mengukur variansi pada setiap nilai x. Jumlah kuadrat yang muncul
dari repleksi disebut jumlah kuadrat galat murni, sedangkan jumlah kuadrat akibat belum cocoknya
model disebut jumlah kuadrat kekurang cocokan.
= +
=
= / seluruhnya ada = =1
Replikasi pada suatu xi menyumbang variansi pada jumlah kuadrat sisa sebeser
2
( )2 = 2 ( ) /
=1 =1 =1
Jika semua variansi ini dijumlahkan maka kita peroleh jumlah kuadrat galat murni
= ( )2
=1 =1
Jumlah kuadrat galat murni adalah bagian (komponen) dari jumlah kuadrat sisa dapat dilihat dari
penjelasan berikut. Sisa ke j pada pengamanan xi adalah
= ( ) + ( )
Perhatikan bahwa semua aplikasi , j= 1,2,3.....,ni pada xi yang sama mempunyai prediksi
yang sama pula. Kuadratkan dan jumlahkan kedua ruas maka diperoleh
( ) = ( ) + ( )2
2 2
=1 =1 =1 =1 =1 =1
Rataan kuadrat galat murni (RKGM) dihitung dengan membagi JKgalat murni dengan dk-
nya. Begitulah, rataan kuadrat kekurangcocokan (RKKC) diperoleh dengan membagi
JKkekurangcocokan dengan dk-nya.Bila kedua taksiran tidak banyak berbeda maka berarti galat yang
ditimbulkan oleh kekurangcocokan model dengan data dapat diabaikaan dan dikatakan bahwa
kekuraangcocokan tidak berarti. Ini berarti bahwa tidak ada alasan meraukan kebaikan model.
Secara formal ini dikerjakan dengan menghitung nisbah
Fhitung =
Fhitung ini kemudian dibanding dengan FV1 ,V2 dari tabel F , bila v1 dan v2, masing masing,
menyatakan dk JKkekurangcocokan dan dk JKgalat murni.
Pandang kembali tabel 2.5 dari bab 2. Darii tabel terlihat bahwa pengamatan nomer 3 dan
4 mempunya replikaasi ,juga nomor 6 dan 7, nomor 8, 9, 10, dan nomor 12, 13. Dua jalur paling
kanan tabel tersebut memberikan jumlah kuadrat galat murni dan derajat kebebasan nya dari tiap
kelompok.
Lihat tabel 2.5 dari bab 2 kembali. Pada bagian bawah tabel itu jumlah kuadrat sisa
diuraikan atas kedua unsurnya: jumlah kuadrat galat murni dan jumlah kuadrat kekurangcocokan.
Begitupun derajat kebebasan sisa mengurai dengan cara yang sama. Rataan kuadrat untuk kedua
bentuk kuadrat tersebut diperoleh seperti biasa dengan membagi jumlah kuadrat dengan derajat
kebebasan yang sesuai. Uji-F untuk kekurangcocokan diperoleh dengan membagi kedua rataan
kuadrat.
Dalam membentuk model kita melihat pola umum data sedangkan dalam analisis sisa kita
lihat penyimpangannya dari pola itu. Dalam setiap analisis data keduanya harus dipadu secara
harmonis agar diperoleh model yang baik.
Bagaimana pentingnya pemeriksaan sisa telah ditunjukan oleh Anscombe melalui contoh berikut.
Pada tabel 6.3 tertera 4 kelompok data (xi,yi).
Kelompok (a) - (c) mempunyai x yang sama sedangkan kelompok (d) nilai x-nya hamper sama
semua kecuali pengamatan yang ke 8. Nilai y untuk tiap kelompok berlainan tapi rata-ratanya
sama, begitu pula variansinya. Tiap pasangan menghasilkan persamaan regresi
y 7,5 0,5( x 9,0)
Atau
y 0,5 x 3, (6.8)
Dengan rxy=0,8165 atau R2=66,7%. Nilai kritis untuk b adalah 0,002. Dari hasil ini
kelihataannya keempat kelompok tidaklah berbeda satu sama lain. Kecocokan antara data dan
model sudah lumayan baik. Koefisien regresi berbeda dengan nol.
Bagian a kedua gambar memperlihatkan bahwa kecocokan antara data dengan model sudah baik
dan kelihatannya sudah tidak dapat lagi diperbaiki. Sisa terlihat acak. Bagian b seperti
Y 0 1 x 11 x 2 , kelihatannya akan lebih baik. Dan bila ini dicoba diperoleh
y 6,00 2,78x 0,13x 2 , R 2 100,0%
Kecocokannya sempurna
Pada bagian c hamper semua datanya terletak pada suatu garis lurus kecuali satu. Kemungkinan
data ini merupakan pencilan, yang tidak jarang terjadi karena salah mencatat. Analisis sebaiknya
dikerjakan dengan membanding kecocokan garis regresi tanpa mengikutsertakan data yang aneh
tersebut. Kalau ini dikerjakan maka diperoleh suatu kecocokkan yang sempurna.
Perbedaan kedua kecocokkan regresi ternyata mencolok. Karena data ini hanya ciptaan,
jadi tidak berasal dari keadaan alam sesungguhnya, maka kita tidak dapat menyarankan kecocokan
yang mana sebaiknya diambil.
Bagian d lebih aneh lagi. Areh garis regresi sepenuhnya ditentukan oleh satu titik data dan
lebih aneh lagi data itu sama sekali tidak mengikuti pola data yang lainnya. Jika data yang aneh
ini dibuang maka sisanya hanyalah replikasi pada x=8,0 sebanyak 10 kali. Untuk mendapatkan
garis regresi yang baik dibutuhkan variasi nilai x yang lebih banyak.
Misalnya dimasukkan dalam bentuk linear padahal seharusnya berbentuk log. Di pihak
lain, data sesungguhnya tidak memenuhi anggapan regresi, seperti kesamaan variansi dan/atau
kenormalan. Dalam hal terakhir ini, harus diusahakan mencari transformasi sehingga, setelah
ditransformasikan, data yang baru ini memenuhi anggapan regresi. Pemilihan transformasi yang
sesuai untuk suatu kelompok data sering tidak begitu mudah. Cara sederhana menanganinya dapat
dilihat di Erickson dan Nosanchuk (1983), sedangkan cara yang lebih lanjut akan dibahas di pasal
6.6.
Tujuan pemeriksaan sisa, secara implisit, juga berarti apakah peubah bebas yang besar
pengaruhnya sudah masuk ke dalam model dan dalam bentuk (linear, kuadrat, log, dsb) yang
sesuai. Secara lebih terperinci tujuan pemeriksaan sisa adalah :
Perlu ditegaskan kembali bahwa uji statistik yang digunakan (t dan F) bersifat kekar. Ini berarti
bahwa anggapan kenormalan dan kesamaan variansi tidak perlu dipenuhi dengan ketat tapi cukup
agak kasar. Di samping itu perlu pula ditegaskan bahwa sesungguhnya distribusi normal lebih
merupakan mitos karena distribusi normal tidak ada dalam praktek. Data selalu diskret, seperti
juga halnya dengan alam semesta ini, sedangkan distribusi normal kontinu.
Berikut ini diberikan beberapa rajah sisa yang penting mengikuti N. Draper dan H. Smith, Applied
Regression Analysis.
Berikut akan dibahas berbagai rajah sisa. Perlu dijelaskan bahwa sisa sebaiknya diajah menurut
setiap cara yang dianggap wajar dan pembahasan disini hanyalah sebagian daripadanya, tidak ada
cara yang baku mengerjakannya.
6.3.1 Rajah Sisa Menurut Besarannya
Gambar 6.3 menyajikan rajah e1, i = 1,2,,n, menurut besarnya dari contoh di tabel
6.2. Dalam gambar ini dua atau lebih titik sisa yang sama besarnya disusun bertumpuk.
Terlihat bahwa rajah a cukup lumayan, dalam arti kata, agak setangkup dan memencar
agak acak dan lebih banyak di tengah. Tidak ada tanda bahwa anggapan keacakan dan
kenormalan dilanggar oleh data. Bagian b agak aneh, datanya mengelompok. Kendati
bentuknya hampir setangkup tapi tidak acak. Pada bagian c, terlihat satu data
menyendiri di sebelah kanan dan cukup jauh dari titik nol (pusat data). Bagian d tidak
menunjukkan keanehan.
Pengamatan no.8 yang aneh memberikan e8 = 0 jadi rajah ini tidak mampu
mengungkapkan kelemahan tersebut, padahal pengamatan ke 8 tersebut mungkin suatu
pencilan.
E =0 dan Var =1
1 1
Jadi sisa terstudent merupakan sekumpulan statistik yang bersifat baku bila syarat ideal dipenuhi.
Jadi setiap simpangan dari gambaran ideal menunjukkan pelanggaran terhadap anggapan baku .
Sisa juga sebaiknya dirajah menurut i dan masing-masing peubah bebas xij , j= 1,2,...,k
Apakah tarnsformasi betul diperlukan ,tergantung pada sejauh mana anggapan tersebut dilanggar
. Pada setiap kasus yang kita hadapi tidak dapat diharapkan bahwa anggapan kenormalan dan
kesamaan variansi akan dipenuhi dengan tepat statistik yang kita pakai mempunyai toleransi yang
cukup besar, jadi tidak mensyaratakan dipenuhinya anggapan tersebut dengan ketat .
Dalam praktek tiak dapat diiharapkann salah satu pola tadi akan muncul dengan jelas ,mungkin
pula yang muncul adalah gabungan antara beberapa pola . Sisa dirajah menurut cara yang dianggap
wajar . Membuat rajah sisa terhadap yi tidaklah banyak menolong dapat menyesatkan karena
demikian model sudah baik antara yi dan ei masih berkorelasi
6.4 Sisa dan Data Berpengaruh
n
Jika 0 0 mak atelah dijelaskan di depan bahwa e
1
i 0 . Begitupun telah dijelaskan di bab 5
bahwa bila modelnya takbias dan p menyatakan banyaknya parameter dalam model maka
n
E ( ei ) 2 (n p) ( lihat persamaan 5.36). jadi derajat kebebasan JK sisa hanya n-p, tidak
2
penuh sama dengan n. Jadi kendati 1 , 2 ,....., n bebas satu sama lain tetapi penaksirnya
e1 , e2 ,....., en tidaklah demikian. Ini berarti bahwa rajah sisa e1 , e2 ,....., en tidak akan benar-benar
acak, karena antara sisa tersebut terdapat korelasi.
Bentuk sisa yang lain ada dua, yaitu sisa terbaku dan sisa terstudent. Sisa terbaku yaitu apabila
anggapan kenormalan dan kesamaan variansi dipenuhi maka 1 / berdistribusi N (0,1), dan di
bawah anggapan keacakan 1 / , i = 1, 2,....,n, bebas satu sama lain. Karena itu beralasan
memandang sisa, dalam dalam bentuk e1 / , i = 1, 2,....,n, bila diketahui dan e1 / s bila
tidak diketahui jika s menyatakan rataan kuadrat sisa. Sisa itulah yang disebut sisa terbaku.
Pengamatan yang jauh dari pusat data sangat mungkin berpengaruh besar terhadap koefisien
regresi dan berpotensi sebagai pencilan. Cara yang dianggap lebih baik untuk membekukan sisa
ialah dengan membagi e i dengan penaksir simpangan bakunya :
ei
ei , i 1,2,..., n
a
s 1 hii
Besaran ini disebut sisa terstudent dan merupakan fungsi monoton dari distribusi t-student dan
dapat dipandang sebagai distribusi t dengan dk = n-p-1. Sisa ini mempunyai beberapa sifat yang
baik , seperti E ei a Eei 0 dan bila modelnya tidak bias, var ei a 1 untuk setiap i. Tetapi
a a
ei ,...., en tidaklah bebas satu sama lain. Dari rumus ini terlihat bahwa bila hii besar (mendekati
pengamatan ke 15 hii 0,06 dan ei* 3,229. Nilai hii 0,147 3 p / n 0,375 tapi e7* 2 , jadi,
kendati hii cukup besar, pengaruhnya tidaklah sampai membuat sisa melebihi 2 simpangan baku.
Sebaliknya untuk pengamatan ke 15, nilai hii sangat kecil (jadi x 4 untuk pengamatan ke 15 dekat
*
ke x 4 ), tapi e15 3 sangat besar. Jika kita gunakan model dengan peubah bebas x1 , x2 , x4 ( p 4)
besar. Pengamatan no.1 yang tadinya tidak menunjukkan keanehan (menggunakan model yang
lebih sederhana) sekarang memberikan e1* 2,700, cukup besar (maksimum); besarnya sisa ini
pengamatan.
Box dan Cox menggunakan metode kemungkinan maksimum untuk menaksir . Taksiran seperti
ini dapat pula dicari dengan mencari nilai yang meminimumkan JKS sebagai fungsi dari .
Untuk berbagi nilai , regresikan rspon z = () terhadap peumab bebas,mgambarkan grafik JKS()
sebagai fungsi dari , kemudian dari grafik baca nilai yang meminimumkan JKS. Ini harus
dikerjakan dengan sedikit main coba coba, mungkin memerlukan sekitar 10 percobaan atau lebih,
misalnya dimulai dengan beberapa nilai seperti = -2,-1,0,1, dan 2.
Selangnya kemudian dipersempit begitu kita mengetahui pada rentangan yang mana letaknya .
Contoh 6.2 Diberkan data berikut :
Nomor x y
1 1.1 79,57
2 2,7 288,14
3 3,3 437,58
4 4,5 749,88
5 5,9 1147,72
6 7,1 1588,68
7 8,4 2231,54
8 8,8 2473,41
9 9,6 2864,86
10 10,4 3241,56
11 10,9 3596,17
12 12,3 4678,13
Rajah data gambar 6.7 menunjukkan bahwa y tidak linear sebagai fungi dari x. Regresi y terhadap
x memberikan rajah peluang normal seperti di gmbar 6.8 dengan korelasi antara sisa dengan
taksirannya.
Transformasi Box dan Cox dicobakan mula-mula untuk = 2, 1, 0, 1, 2. Terlihat dari hasilnya
minimum JKS terletak antara 0 < < 1. Kemudian dicobakan beberapa nilai lagi, yaitu =
0,4; 0,5; 0,6. Ternyata = 0,5 memberikan hasil minimum. Hampir tidak banyak hasil akhirnya
jika yang diambil = 0,55 atau 0,5. Untuk = 0.5 diperoleh 2 = 99,9% (hamper sempurna).
dk diambil 9, berkurang 1 karena ditaksir. Korelasi sisa dengan taksiran harapannya 0,987.
Terlihat bahwa transformasi = () = dapat memperbaiki model.
Tabel 6.5 Beberapa statistik yang dipelukan
Peubah bebas Koefisien Simp. Baku nisbah-t P
Tetapan 154,39 24,35 6,34 0,000
X 367,259 3,095 118,67 0,000
s = 36,77 R2 = 99,9%
6.5.2 Transformasi pada x
Transformasi ini digunakan bila suku galat dianggap telah memenuhi anggapaan kenormalan,
tetapi belum semua peubah bebas 1 , 2 , , terkait secara linear dengan respons . Box dan
Tidwell (1962) mengusulkan transformasi
, 0
= { (6.12)
ln , = 0.
Kemudian gunakan model
= 0 + 1 + (6.13)
ditaksir melalui proses iterasi dan kekonvergenan, dalam banyak hal, dicapai secara cepat. Pada
nilai limit , JKS mencapai minimum sebagai fungsi dari . Iterasi dapat dimulai dari = 1 dan
dilanjutkan sebagai berikut:
Regresikan ( = 1) = 0 + 1 .
Kemudian bentuk peubah bebas baru, namakan misalnya z,
= . ln .
Regresikan terhadap dan :
= 01 + 11 + 1 .
Perhatikan bahwa umumnya 0 01 dan 1 11.
Misalkan selanjutnya
1 = (1 /1 ) + 1.
Pandang peubah baru = 1 dan ulangi proses semua. Deretan nilai 1 , 2 , akan menuju 1
akhirnya dan kemudian ambil
= 1 , 2 , ,
Bila iterasi dilakukan k kali.
Contoh 6.3 Diberikan data berikut (lihat tabel 6.6). Rajah data mentah disajikan digambar 6.10
yang menunjukkan bahwa bukan fungsi linear dari .
Regresi terhadap memberikan 2 = 61,2% dan pemeriksaan sisa menunjukkan adanya pola
yang tidak acak.
Ambil = 1 dan pandang = ln . Regresikan terhadap dan kemudian terhadap dan :
= 7,4788 0,570254 ,
Tabel 6.6 Data untuk contoh 6.3
x y
1 2,3 5,05
2 1,4 7,06
3 10,3 2,40
4 6,7 3,36
5 8,4 3,49
6 9,2 3,63
7 5,3 4,46
8 4,7 3,84
9 7,1 3,34
10 3,8 3,44
11 5,6 3,97
12 6,2 3,15
13 4,9 3,94
14 3,5 3,75
15 2,4 4,74
16 9,4 3,17
17 6,9 2,89
18 7,6 2,99
19 0,8 9,72
20 1,2 6,30
21 0,7 10,55
1,21699
1 = + 1 = 1,13413.
0,570254
0,313117
2 = + 1 = 0,94039.
5,25005
10
7
y
2
0 2 4 6 8 10
x
Untuk tujuan praktis sesungguhnya lebih baik mengambil = 1, jadi transformasi menjadi =.
Yang terakhir ini lebih mudah ditafsirkan dan beda hasilnya dengan = 1,06 dapat diabaikan
untuk tujuan praktis.
Metode ini dapat diperluas sehingga mencakup k peubah bebas 1, 2,., . Transformasi menjadi
x j , j 0
x
*
ln x, j 0
j
Untuk j = 1, 2, ...,k. Dalam hal ini akan diperlukan k peubah bebas tambahan 1, 2,., dengan
bila dan nilai peubah acak , pada suatu tahap iterasi. Sebagai nilai permulaan dapat
diambil 1 = 2 = . = = 1.
6.5.3 Transformasi Menstabilkan Variansi
jika anggapan kesamaan variansi tidak dipenuhi maka diperlukan suatu transformasi untuk
menstabilkannya. transformasi ini umumnya menyangkut y dan kadang-kadang y dan x bersama-
sama. Pemilihan transformasi tergantung pada bentuk pelanggaran yang dihadapi. Rajah data
mentah y terhadap x, rajah sisa dan terhadap dan terhadap x akan sangat menolong mengenali
bentuknya. Transformasi ini diharapkan tidak saja menstabilkan variansi tapi juga membuat
anggapan kenormalan dipenuhi dengan lebih baik.
Gambar 6.11 memperlihatkan rajah data mentah y terhadap x yang berasal dari proporsi yang
berhasil pada distribusi binom dengan n = 5. Bilangan pada gambar menunjukkan banyaknya titik
data yang terletak di tempat itu. Terlihat pemencaran di tengah lebih lebar dari pada kedua
pinggirnya. Regresi sederhana y terhadap x menghasilkan sisa seperti gambar 6.12 yang
memperlihatkan lebih jelas bahwa kesamaan variansi memang dilanggar. Data seperti ini sering
muncul dari percobaan di laboratorium atau data yang bersifat proporsi. Pada distribusi binom
variansi merupakan fungsi dari rataannya.
Gambar 6.13 berasal dari distribusi Poisson n = 17, 2, memperlihatkan bentuk pemencaran
yang mirip dengan gambar 6.4 (c).
Pada distribusi Poisson rataan sama dengan variansi. Pada kedua contoh ini variansi
berkaitandengan rataan. Mengingat bahwa dalam model regresi (sederhana) E ( y) 0 x, jadi
E(y)berubah linier terhadap x, maka var (y) juga akan ikut berubah mengikuti x, sehingga anggapan
kesamaan variansi dilanggar pada kedua contoh ini.
Banyak contoh dalam praktek yang dapat dikemukakan yang mirip dengan contoh ini.
Kendall dan Stuart (1983), h. 98-102, begitu pula Bartlett (1947), h. 39-52, membahas cara
pemilihan transformasi bila var (y) merupakan fungsi dari E(y). Dalam hal Poisson maka
transformasi y = akan menyelesaikan masalah karena var () tidak tergantung pada
Jika anggapan kesamaan variansi tidak dipenuhi maka variansi dari taksiran koefisien regresi akan
membengkak (Teorema Gauss-Markov tidak lagi berlaku). Umumnya y harus lebih besar dari 0
agar dapat menggunakan transformasi di tabel 6.9. Fungsi log y akan mendekatkan nilai y yang
besar dan meregangkan nilai-nilai y yang kecil. Transformasi 1/ sedikit lebih keras dari log y
dan 1/y lebih keras dari . Transformasi 1/y akan cocok digunakan bila nilai-nilai (positif) dekat
0 (antara 0 dan 1) amat rapat sedangkan nilai y yang besar ada tapi amat jarang.
Contoh 6.4 Diketahui data berikut: Rajah data mentah dan pemencaran di tengah lebih lebar
daripada kedua pinggirnya, y berdistribusi Poisson. Penggunaan transformasi + + 1
menghasilkan persamaan regresi seperti di tabel 6.10 dengan rajah sisa. Korelasi sisa dengan
taksiran harapannya 0,994 dan rajah peluang normal cukup lurus.
Perlu dikemukakan bahwa transformasi diperlukan agar anggapan dalam model yang digunakan
dipenuhi tapi tafsiran hendaknya dikerjakan dalam peubah yang semula karena peubah semula itu
yang dihadapi dalam kenyataannya.
No. y x No. y X
1 1,97 1 21 3,30 21
2 2,02 2 22 2,84 22
3 3,04 3 23 3,20 23
4 2,12 4 24 2,54 24
5 2,77 5 25 3,27 25
6 2,21 6 26 3,72 26
7 2,46 7 27 3,61 27
8 2,70 8 28 3,39 28
9 2,54 9 29 3,24 29
10 2,94 10 30 3,27 30
11 2,98 11 31 3,98 31
12 2,84 12 32 4,01 32
13 3,20 13 33 3,91 33
14 2,91 14 34 4,41 34
15 3,11 15 35 3,56 35
16 3,59 16 36 3,86 36
17 3,47 17 37 3,75 37
18 3,78 18 38 3,36 38
19 3,08 19 39 3,53 39
20 3,70 20 40 3,70 40
Sering pula var (y) merupakan fungsi dari peubah bebas x, misalnya
var (y) = 2 , k suatu tetapan.
Dalam hal var (y) = 2 , transformasi = y/x akan membuat var ( ) stabil, karena
1
var (y/x) = 2 var (y) = k.
Dengan jalan yang sama, bila var (y) = , k dan m tetapan, maka transformasi
= y/ /2
Contoh 6.5 Diberikan data berikut. Diketahui rajahnya menunjukkan bahwa makin besar x
pemencaran data y makin lebar pula. Data ini mempunyai replikasi yang memudahkan untuk
menghitung besarnya pemencaran sebagai fungsi dari x.
Tabel 6.10 Beberapa statistik untuk data contoh 6.4
Predictor Koefisien Simpangan baku Nisbah-t P
Tetapan 3,39542 0,06666 50,93 0,000
X 0,021616 0,002833 7,63 0,000
s = 0,2069 R-sq = 60,5% R-sq (adj) = 59,5%
2
Terlihat bahwa nisbah var () sedikit berfluktuasi disekitar k = 2. Gunakan transformasi =