Professional Documents
Culture Documents
STATISTIKA TERAPAN
Disusun oleh :
WIRDA ANDANI
G152160281
Departemen Statistika
Fakultas Matematika dan Ilmu Pengetahuan Alam
SEKOLAH PASCASARJANA INSTITUT PERTANIAN
BOGOR
2016
JAWAB
a. Dibawah ini disajikan scatterplot yang menggunakan software
MINITAB dari data yaitu x versus y
Scatterplot of y vs x
90
80
70
60
50
40
30
20
10
0
10
15
x
20
25
b.
No
14
28
10
43
18
62
23
79
6
mea
n
30
15.333
33
87
52.166
67
x-x
12.333
3
7.3333
3
5.3333
3
2.6666
67
7.6666
67
14.666
67
y-y
30
(x-x ) (yy )
(x-x )^2
-38.1667
470.72222 152.111
22 1
-24.1667
177.22222 53.7777
22 8
-9.16667
9.833333
26.83333
34.83333
sum
48.888888
89
26.222222
22
205.72222
22
510.88888
89
28.4444
4
7.11111
1
58.7777
8
215.111
1
1439.6666
67
515.333
3
Y^ = 0 + 1X
1 =
( x x ) ( y y ) =
( xx )2
0 = y - 1 x
1439.666667
515.3333
2.794
Y^ =9,33+ 2,794 X
Dengan menggunakan software MINITAB ternyata didapatkan juga
model regresi yang sama yaitu sebagai berikut :
Regression Analysis: y versus x
The regression equation is
y = 9,33 + 2,79 x
a. Dari output MINITAB dapat kita lihat ternyata persamaan regresi nya adalah :
^y = 0 + 1X = 3,6+2,06 X
Scatterplot of Y vs X
300
250
200
150
100
50
0
0
20
40
60
X
80
100
120
response
20
15
10
5
0
0
10
20
30
40
doseLVL
50
b.
60
70
10
14
15
17
20.26667
20.26667
20.26667
18.26667
18.26667
14.26667
14.26667
16
20
6.266667
1.866667
16
21
6.266667
2.866667
10
16
19
6.266667
0.866667
11
32
23
9.73333
4.866667
12
32
29
9.73333
10.86667
13
64
28
41.73333
9.866667
14
64
31
41.73333
12.86667
15
Mea
n
64
22.26
67
30
18.1
33
41.73333
11.86667
(x-x )(y-y
)
266.16888
89
225.63555
56
306.70222
22
148.56888
89
75.502222
22
44.702222
22
16.168888
89
11.697777
8
17.964444
4
5.4311111
1
47.368888
89
105.76888
89
411.76888
89
536.96888
89
495.23555
56
Sum
2645.4666
67
No
x-x
y-y
-13.1333
-11.1333
-15.1333
-8.13333
-4.13333
-3.13333
-1.13333
(x-x
)^2
410.73
78
410.73
78
410.73
78
333.67
11
333.67
11
203.53
78
203.53
78
7838.9
33
39.271
11
39.271
11
39.271
11
94.737
78
94.737
78
1741.6
71
1741.6
71
1741.6
71
( xx )
(
y
y )
1 =
0 = y - 1 x
2645.466667
7838.933
0.337
response
25
20
15
10
5
0
0
10
20
30
40
doseLVL
50
60
70
c. Untuk mengetahui apakah lack of fit bermakna atau tidak bisa kita
lihat melalui scatterplot dari residual vs nilai dugaan ( ^y ). Dibawah
ini disajikan scatterplot yang menggunakan software MINITAB.
Versus Fits
(response is y)
Residual
-5
-10
10
15
20
25
Fitted Value
30
35
DF
1
13
4
9
14
SS
892,79
284,95
242,28
42,67
1177,73
Karena p-value =
fit bermakna.
0,001<
MS
892,79
21,92
60,57
4,74
F
40,73
P
0,000
12,78
0,001
E3 ( y )= 0 + 2
Jika, dimisalkan E1 ( y ) sebagai 1 ,
sebagai 3, maka diperoleh:
1= 0
2= 0 + 1=1 + 1
Sehingga diperoleh nilai s :
0=1
1=21
E2 ( y ) sebagai
2 dan
E3 ( y )
3= 0 + 2=1 + 2
2=31
FER
1
0
20
40
60
80
100
Additive
b. Dari plot diatas dapat kita lihat ternyata sebaran titik tidak linear (non linear) sehingga
regresi linear sederhana tidak dapat digunakan untuk data diatas. Dan dilihat dari
sebaran titiknya terlihat bahwa sebaran titik mendekati kurva kubik sehingga data
diatas akan lebih tepat digunakan jika menggunakan model regresi kubik.
c. Dibawah adalah output yang tersedia disoal (buku Brooks-Cole 2010 hal 732-733)
Berdasarkan output di atas, maka model regresi yang paling baik adalah model regresi
kubik, karena memiliki nilai korelasi (R2) dan R2 addjusted yang paling besar
dibanding model regresi linear dan kuadratik yaitu sebesar 0,9729 dan 0,9715.
Semakin tinggi nilai korelasi (R2) dan R2 addjusted artinya model yang didapat
semakin bagus. Selain itu RMSE model regresi kubik adalah yang paling kecil
dibanding model regresi linear dan kuadratik yaitu sebesar 0,17988. Semakin kecil
RMSE maka semakin baik pula modelnya.
d. Tidak karena data didapat dari penelitian.
Coef
1,6407
0,002483
0,00026522
0,0002050
S = 0,308659
SE Coef
0,2170
0,009303
0,00008930
0,0004455
R-Sq = 94,3%
T
7,56
0,27
2,97
0,46
P
0,000
0,796
0,018
0,658
R-Sq(adj) = 92,2%
Analysis of Variance
Source
Regression
Residual Error
Total
Source
x1
x1^2
x2
DF
1
1
1
DF
3
8
11
Seq SS
11,7786
0,8404
0,0202
SS
12,6392
0,7622
13,4013
MS
4,2131
0,0953
F
44,22
P
0,000
Model 2
Regression Analysis: y versus x1; x1^2; x2; x1x2; x1^2x2
The regression equation is
y = 1,66 + 0,0027 x1 + 0,000258 x1^2 + 0,00012 x2 - 0,000001 x1x2
+ 0,000000 x1^2x2
Predictor
Constant
x1
x1^2
x2
x1x2
x1^2x2
Coef
1,6586
0,00267
0,0002579
0,000116
-0,00000091
0,00000004
S = 0,355249
SE Coef
0,3220
0,01514
0,0001454
0,001138
0,00005354
0,00000051
R-Sq = 94,3%
T
5,15
0,18
1,77
0,10
-0,02
0,07
P
0,002
0,866
0,126
0,922
0,987
0,945
R-Sq(adj) = 89,6%
Analysis of Variance
Source
Regression
Residual Error
Total
Source
x1
x1^2
x2
x1x2
x1^2x2
DF
1
1
1
1
1
DF
5
6
11
SS
12,6441
0,7572
13,4013
MS
2,5288
0,1262
F
20,04
P
0,001
Seq SS
11,7786
0,8404
0,0202
0,0043
0,0006
S
R-sq
Rsq(adj)
MSE
model
1
0,3086
59
94,3%
model
2
0,3552
49
94,3%
92,2%
0,0953
89,6%
0,1262
Untuk menentukan model yang terbaik dilihat dari R-sq dan R-sq yang paling tinggi
karena semakin tinggi semakin bagus x dalam menjelaskan y sehingga model mnjadi
lebih baik. Dari hasil diatas ternyata yg memiliki R-sq dan R-sq aj tinggi adalah
model 1. Selain itu dapat dilihat dari S yang terkecil karena semakin kecil artinya
ragamnya juga akan semakin kecil. Dan juga dilihat dari MSE paling kecil, karena
semakin kecil MSE artinya dugaan semakin mendekati data aslinya. Dari hasil
ternyata yg memiliki S dan MSE kecil adalah model 1. Maka dapat disimpulkan
model 1 adalah model yang terbaik
b. Persamaan regresi dari model yang terbaik yaitu model 1 adalah sebagai berikut
Regression Analysis: y versus x1; x1^2; x2