You are on page 1of 9

Uji Asumsi Klasik

I. Multikolinearitas Multikolinearitas dapat didefinisikan sebagai adanya hubungan atau korelasi yang cukup kuat antara sesama variabel bebas yang disertakan dalam model. Adapun definisi lain adalah korelasi linear yang perfect atau eksak di antara variabel penjelas yang dimasukkan ke dalam model. Multikolinearitas bukan muncul tanpa sebab, ada beberapa sebab yang dapat dikemukakan, diantaranya yaitu cara pengambilan data, ukuran sampel yang dipakai terlalu kecil, acuan yang digunakan pada model atau populasi yang disampel, spesifikasi model yang tidak tepat, dan ketidakseimbangan variabel dalam model dengan jumlah sampel.

Implikasi Multikolinearitas Gejala multikolinearitas sebenarnya tidak akan mengubah sifat parameter OLS yang BLUE (Best Linear Unbiased Estimator). Parameter yang diperoleh dari estimasi yang terkena multikolinearitas ini dapat dikatakan valid untuk mencerminkan kondisi populasi dan cukup baik bagi estimator yang sifatnya linier. Secara matematik dapat ditunjukkan bahwa dengan adanya multikolinearitas tersebut maka standard error koefisien regresi akan meningkat. Akibatnya t-rasio akan bernilai cukup rendah dan dengan demikian pengujian yang bersangkutan akan cenderung menunjukkan hasil yang tidak signifikan sehingga dengan keberadaan multicollinearity tersebut membuat kita cenderung akan menyimpulkan bahwa variabel bebas yang berkorelasi tadi tidak signifikan walau sesungguhnya pengaruhnya signifikan terhadap variabel terikat. Di samping itu dengan standard error yang meningkat tersebut, maka confidence interval yang diperoleh akan semakin lebar pula. Hal ini tentu saja tidak kita inginkan. Kemudian dengan adanya multicollinearity tak jarang menyebabkan tanda (sign) dari koefisien regresi yang diperoleh berlawanan dengan semestinya. Hal ini jelas akan sangat menyulitkan dalam membuat interpretasi terhadap hasil pendugaan.

Asistensi II/PPIE FE UI/4 Okt 2011/ARH

Teknik Deteksi Multikolinearitas Multikolinearitas sering disebut Gujarati (2003) sebagai suatu fenomena sampling karena terjadi pada sampel bukan pada populasi. Hal ini terjadi jika model telah secara tepat menaruh variabel yang masuk sehingga memungkinkan model untuk bekerja pada populasi. Pada kondisi ini, multikolinearitas seharusnya tidak pernah menjadi suatu masalah yang berarti. Meski demikian, multikolinearitas perlu dideteksi, ada beberapa cara untuk mengetahui ada tidaknya multikolinearitas, yaitu : 1. Jika dari model yang kita duga diperoleh nilai koefisien determinasi ( R 2 ) yang cukup tinggi dan dengan F-test yang signifikan, lalu dengan t-test tidak ditemukan adanya koefisien yang signifikan. Dan kalau pun ada koefisien yang signifikan, jumlahnya relatif sangat sedikit sekali. Kondisi yang seperti ini juga mengidikasikan adanya multicollinearity. 2. Multikolinearitas dapat dideteksi dengan melihat koefisien korelasi antar variabel regressor. Jika ada di antara variabel bebas tersebut yang berkorelasi cukup tinggi, maka hal itu merupakan indikasi adanya multicollinearity. Akan tetapi dengan melihat koefisien itu saja sebenarnya belum cukup. Artinya, mungkin saja nilai koefisien korelasi tersebut relatif kecil, tapi persoalan multikolinearitas tadi tetap ada. Selain itu harus pula disadari bahwa biasanya nilai koefisien korelasi antara dua variabel sangat dipengaruhi oleh banyaknya observasi. Dengan jumlah observasi yang relatif banyak, ada kalanya koefisien korelasi tersebut cenderung bernilai kecil. 3. Overall significance dari Auxiliary Regression. Kita membuat regresi auxiliary antara variabel-variabel yang dicurigai mengalami multikolinearitas dan menghitung overall significance (F-test). Regresi auxiliary mendukung dugaan adanya multikolinearitas.

Perbaikan Multikolinearitas Karena ada silang pendapat terkait kolinearitas, maka ada banyak cara untuk mengatasinya. Pendapat ekstrim berupa tidak perlu dilakukan perbaikan, disamping ada juga kemungkinan untuk memperbaikinya. Upaya yang dapat dilakukan diantaranya : 1. Penggunaan informasi apriori yang bersifat non sample. Informasi ini dapat ditemukan dari teori, penelitian lain yang telah dilakukan, atau judgement peneliti. 2. Penggabungan data cross section dengan runtut waktu, sering kita menyebutnya dengan data panel.
Asistensi II/PPIE FE UI/4 Okt 2011/ARH

3. Melakukan penggantian atau mengeluarkan variabel yang tidak menyebabkan kesalahan spesifikasi. Dengan kata lain, variabel tersebut tidak berasal dari teori dan bersifat subtitusi terhadap variabel lainnya. Seperti ilustrasi sebelumnya, ada dua variabel independen yang identik yaitu jumlah kendaraan dan ukuran rumah, nota bene keduanya dapat menjadi proksi kekayaan maka seharusnya dapat dihilangkan salah satu. 4. Transformasi variabel yang akan digunakan. Bentuknya dapat berupa penggunaan derajat pertama, pembobotan atau penggunaan rasio, serta bentuk logaritma.

Asistensi II/PPIE FE UI/4 Okt 2011/ARH

Praktek Eviews

Dengan menggunakan data Longley, kita akan mencoba melakukan penerapan salah satu pengujian asumsi klasik yaitu multikolinearitas. Langkah-langkahnya adalah sebagai berikut : 1. Data yang akan digunakan sebagai latihan diberi nama file latih_1.
obs Y X1 X2 X3 X4 1947 60323 83.0 234289 2356 1590 1948 61122 88.5 259426 2325 1456 1949 60171 88.2 258054 3682 1616 1950 61187 89.5 284599 3351 1650 1951 63221 96.2 328975 2099 3099 1952 63639 98.1 346999 1932 3594 1953 64989 99.0 365385 1870 3547 1954 63761 100.0 363112 3578 3350 1955 66019 101.2 397469 2904 3048 1956 67857 104.6 419180 2822 2857 1957 68169 108.4 442769 2936 2798 1958 66513 110.8 444546 4681 2637 1959 68655 112.6 482704 3813 2552 1960 69564 114.2 502601 3931 2514 1961 69331 115.7 518173 4806 2572 1962 70551 116.9 554894 4007 2827 2. Lakukan estimasi regresi sehingga didapatkan hasil berikut.
Dependent Variable: Y Method: Least Squares Date: 10/02/11 Time: 08:21 Sample: 1947 1962 Included observations: 16 Coefficient Std. Error X1 X2 X3 X4 X5 X6 C R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic) 15.06187 -0.035819 -2.020230 -1.033227 -0.051104 1829.151 77270.12 0.995479 0.992465 304.8541 836424.1 -109.6174 330.2853 0.000000 84.91493 0.033491 0.488400 0.214274 0.226073 455.4785 22506.71 t-Statistic 0.177376 -1.069516 -4.136427 -4.821985 -0.226051 4.015890 3.433204 Prob. 0.8631 0.3127 0.0025 0.0009 0.8262 0.0030 0.0075 65317.00 3511.968 14.57718 14.91519 14.59449 2.559488

X5 107608 108632 109773 110929 112075 113270 115094 116219 117388 118734 120445 121950 123366 125368 127852 130081

X6 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Durbin-Watson stat

Asistensi II/PPIE FE UI/4 Okt 2011/ARH

3. Terlihat bahwa hasil regresi memiliki nilai R2 bernilai lebih dari 0,9 serta terdapat tiga variabel yang tidak signifikan (x1, x2, dan x5). Kondisi ini diduga terdapat multikolinearitas dalam persamaan regresi tersebut. Penaksir kedua, dapat dilakukan korelasi pairwise. Adapun langkahnya sebagai berikut. Dari output regresi, pilih View -> Covariance Matrix.

Sehingga diperoleh hasil sebagai berikut.


X1 X2 X3 X4 X5 X6 X1 6069.579 -0.575245 -6.691591 -9.892640 -3.284273 4553.204 X2 -0.575245 0.001137 0.017092 0.005783 -0.002286 -21.60622 X3 -6.691591 0.017092 0.305944 0.119333 -0.037504 -332.9806 X4 -9.892640 0.005783 0.119333 0.094219 -0.008074 -107.5956 X5 -3.284273 -0.002286 -0.037504 -0.008074 0.008080 48.50370 X6 4553.204 -21.60622 -332.9806 -107.5956 48.50370 419064.1

Terlihat bahwa koefisien korelasi beberapa variabel cukup tinggi, maka diduga terdapat gejala multikolinearitas. 4. Perlu dilakukan koreksi untuk memperbaiki gejala multikolinearitas tersebut. Upaya yang dapat dilakukan, yaitu (i) membentuk variabel baru yaitu z dengan membagi x2 dengan x1. Disini z adalah GNP riil, sedangkan x1 merupakan GNP nominal dan x2 merupakan GNP deflator. (ii) memilih salah satu variabel antara time dan x5. Untuk kasus ini, maka dipilih variabel x5. (iii) tidak memasukkan x3 (jumlah pengangguran) sebagai penjelas dari jumlah orang yang bekerja. Setelah dilakukan estimasi ulang, maka didapat hasil sebagai berikut.

Asistensi II/PPIE FE UI/4 Okt 2011/ARH

Dependent Variable: Y Method: Least Squares Date: 10/01/11 Time: 12:07 Sample: 1947 1962 Included observations: 16 Coefficient Z X4 X5 C R-squared Adjusted R-squared S.E. of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic) 9.736496 -0.687966 -0.299537 65720.37 0.981404 0.976755 535.4492 3440470. -120.9313 211.0972 0.000000 Std. Error 1.791552 0.322238 0.141761 10624.81 t-Statistic 5.434671 -2.134965 -2.112965 6.185558 Prob. 0.0002 0.0541 0.0562 0.0000 65317.00 3511.968 15.61641 15.80955 15.62630 1.654069

Mean dependent var S.D. dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter. Durbin-Watson stat

Terlihat bahwa nilai koefisien determinasi menurun dibandingkan sebelumnya serta semua variabel sudah signifikan.

Asistensi II/PPIE FE UI/4 Okt 2011/ARH

Praktek Stata

Dengan menggunakan data Longley, kita akan mencoba melakukan penerapan salah satu pengujian asumsi klasik yaitu multikolinearitas dengan menggunakan perangkat lunak stata. Langkah-langkahnya adalah sebagai berikut : 1. Data yang akan digunakan sebagai latihan diberi nama file latih_1.
obs 1947 1948 1949 1950 1951 1952 1953 1954 1955 1956 1957 1958 1959 1960 1961 1962 Y 60323 61122 60171 61187 63221 63639 64989 63761 66019 67857 68169 66513 68655 69564 69331 70551 X1 83.0 88.5 88.2 89.5 96.2 98.1 99.0 100.0 101.2 104.6 108.4 110.8 112.6 114.2 115.7 116.9 X2 234289 259426 258054 284599 328975 346999 365385 363112 397469 419180 442769 444546 482704 502601 518173 554894 X3 2356 2325 3682 3351 2099 1932 1870 3578 2904 2822 2936 4681 3813 3931 4806 4007 X4 1590 1456 1616 1650 3099 3594 3547 3350 3048 2857 2798 2637 2552 2514 2572 2827 X5 107608 108632 109773 110929 112075 113270 115094 116219 117388 118734 120445 121950 123366 125368 127852 130081 X6 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

2. Lakukan estimasi regresi sehingga diperoleh hasil sebagai berikut.


Source Model Residual Total y x1 x2 x3 x4 x5 x6 _cons SS 184172402 836424.129 185008826 Coef. 15.06167 -.0358191 -2.020229 -1.033227 -.0511045 1829.151 77270.16 df 6 9 15 MS 30695400.3 92936.0144 12333921.7 t 0.18 -1.07 -4.14 -4.82 -0.23 4.02 3.43 P>|t| 0.863 0.313 0.003 0.001 0.826 0.003 0.007 Number of obs F( 6, 9) Prob > F R-squared Adj R-squared Root MSE = = = = = = 16 330.29 0.0000 0.9955 0.9925 304.85

Std. Err. 84.91486 .033491 .4883995 .2142741 .2260731 455.4785 22506.69

[95% Conf. Interval] -177.0291 -.111581 -3.125065 -1.517948 -.5625173 798.7873 26356.48 207.1524 .0399428 -.9153928 -.5485049 .4603083 2859.515 128183.8

3. Terlihat bahwa hasil regresi memiliki nilai R2 bernilai lebih dari 0,9 serta terdapat tiga variabel yang tidak signifikan (x1, x2, dan x5). Kondisi ini diduga terdapat multikolinearitas dalam persamaan regresi tersebut. Penaksir kedua, dapat dilakukan korelasi pairwise. Adapun langkahnya dengan menuliskan perintah corr x1 x2 x3 x4 x5 x6 sehingga diperoleh hasil sebagai berikut.
Asistensi II/PPIE FE UI/4 Okt 2011/ARH

x1 x1 x2 x3 x4 x5 x6 1 . 00 0 0 0 . 99 1 6 0 . 62 0 6 0 . 46 4 7 0 . 97 9 2 0 . 99 1 1

x2

x3

x4

x5

x6

1 .0 0 00 0 .6 0 43 1 . 0 00 0 0 .4 4 64 -0 . 1 77 4 0 .9 9 11 0 . 6 86 6 0 .9 9 53 0 . 6 68 3

1 .0 0 0 0 0 .3 6 4 4 0 .4 1 7 2

1 . 0 00 0 0 . 9 94 0

1 .0 0 0 0

Terlihat bahwa koefisien korelasi X1X2; X1X5; dan X2X5cukup tinggi, maka diduga terdapat gejala multikolinearitas. 4. Kita dapat juga melakukan pengujian dengan menuliskan perintah VIF.
Variable x2 x6 x5 x1 x3 x4 Mean VIF VIF 1788.51 758.98 399.15 135.53 33.62 3.59 519.90 1/VIF 0.000559 0.001318 0.002505 0.007378 0.029745 0.278635

Terlihat juga bahwa nilai VIF lebih besar daripada rule of thumb sebesar 20 yang cenderung menunjukkan ada gejala multikolinearitas. 5. Perlu dilakukan koreksi untuk memperbaiki gejala multikolinearitas tersebut. Upaya yang dapat dilakukan, yaitu (i) membentuk variabel baru yaitu z dengan membagi x2 dengan x1. Disini z adalah GNP riil, sedangkan x1 merupakan GNP nominal dan x2 merupakan GNP deflator. (ii) memilih salah satu variabel antara time dan x5. Untuk kasus ini, maka dipilih variabel x5. (iii) tidak memasukkan x3 (jumlah pengangguran) sebagai penjelas dari jumlah orang yang bekerja. Setelah dilakukan estimasi ulang, maka didapat hasil sebagai berikut.

Asistensi II/PPIE FE UI/4 Okt 2011/ARH

Source Model Residual Total y z x4 x5 _cons

SS 181568352 3440474.03 185008826 Coef. 9.736497 -.687966 -.2995366 65720.36

df 3 12 15

MS 60522784 286706.169 12333921.7 t 5.43 -2.13 -2.11 6.19 P>|t| 0.000 0.054 0.056 0.000

Number of obs F( 3, 12) Prob > F R-squared Adj R-squared Root MSE

= = = = = =

16 211.10 0.0000 0.9814 0.9768 535.45

Std. Err. 1.791554 .3222378 .1417614 10624.82

[95% Conf. Interval] 5.833036 -1.390062 -.6084081 42570.88 13.63996 .01413 .009335 88869.85

Terlihat bahwa nilai koefisien determinasi menurun dibandingkan sebelumnya serta semua variabel sudah signifikan.

Asistensi II/PPIE FE UI/4 Okt 2011/ARH

You might also like