You are on page 1of 15

TUGAS ANALISIS STATISTIKA

STATISTIKA TERAPAN

Disusun oleh :
WIRDA ANDANI
G152160281

Departemen Statistika
Fakultas Matematika dan Ilmu Pengetahuan Alam
SEKOLAH PASCASARJANA INSTITUT PERTANIAN
BOGOR
2016

JAWAB
a. Dibawah ini disajikan scatterplot yang menggunakan software
MINITAB dari data yaitu x versus y
Scatterplot of y vs x
90
80
70

60
50
40
30
20
10
0

10

15
x

20

25

b.
No

14

28

10

43

18

62

23

79

6
mea
n

30
15.333
33

87
52.166
67

x-x
12.333
3
7.3333
3
5.3333
3
2.6666
67
7.6666
67
14.666
67

y-y

30

(x-x ) (yy )

(x-x )^2

-38.1667

470.72222 152.111
22 1

-24.1667

177.22222 53.7777
22 8

-9.16667
9.833333
26.83333
34.83333

sum

48.888888
89
26.222222
22
205.72222
22
510.88888
89

28.4444
4
7.11111
1
58.7777
8
215.111
1

1439.6666
67

515.333
3

Y^ = 0 + 1X
1 =

( x x ) ( y y ) =
( xx )2

0 = y - 1 x

1439.666667
515.3333

2.794

52.16667 (2.794 x 15.33333) = 9.33

Setelah didapatkan hasil maka persamaan regresinya adalah :

Y^ =9,33+ 2,794 X
Dengan menggunakan software MINITAB ternyata didapatkan juga
model regresi yang sama yaitu sebagai berikut :
Regression Analysis: y versus x
The regression equation is
y = 9,33 + 2,79 x

c. Tentukan y ketika x=12


^y =9,33+ 2,794 X
9,33+2,794 ( 12 )
42,858
Maka y akan sebesar 42,858 jika x=12

a. Dari output MINITAB dapat kita lihat ternyata persamaan regresi nya adalah :
^y = 0 + 1X = 3,6+2,06 X
Scatterplot of Y vs X
300
250

200
150
100
50
0
0

20

40

60
X

80

100

120

b. Ketepatan garis regresi dapat dilihat apabila semua sebaran titik


mendekati garis regresi. Dilihat dari scatterplot ternyata sebaran
titik berada di sekitar garis regresi. Selain itu ketepatan garis regresi
dapat diterangkan dengan menggunakan nilai R2 dimana semakin
besar nilai tersebut (mendekati 1) maka model semakin baik.
Berdasarkan output di atas, nilai R 2 adalah 0,95. Karena sebaran
titik mendekati garis regresi dan nilai R2 mendekati 1 maka dapat
disimpulkan garis regresi sudah dapat mewakili data.
c. Tentukan y ketika x=57
^y =3,6+ 2,06 X
3,6+2,06 ( 57 )
121,02

a. Dibawah ini disajikan scatterplot yang menggunakan software


MINITAB dari data yaitu dose level versus response

Scatterplot of response vs doseLVL


30
25

response

20
15
10
5
0
0

10

20

30
40
doseLVL

50

b.

60

70

10

14

15

17

20.26667
20.26667
20.26667
18.26667
18.26667
14.26667
14.26667

16

20

6.266667

1.866667

16

21

6.266667

2.866667

10

16

19

6.266667

0.866667

11

32

23

9.73333

4.866667

12

32

29

9.73333

10.86667

13

64

28

41.73333

9.866667

14

64

31

41.73333

12.86667

15
Mea
n

64
22.26
67

30
18.1
33

41.73333

11.86667

(x-x )(y-y
)
266.16888
89
225.63555
56
306.70222
22
148.56888
89
75.502222
22
44.702222
22
16.168888
89
11.697777
8
17.964444
4
5.4311111
1
47.368888
89
105.76888
89
411.76888
89
536.96888
89
495.23555
56

Sum

2645.4666
67

No

x-x

y-y
-13.1333
-11.1333
-15.1333
-8.13333
-4.13333
-3.13333
-1.13333

(x-x
)^2
410.73
78
410.73
78
410.73
78
333.67
11
333.67
11
203.53
78
203.53
78

7838.9
33

39.271
11
39.271
11
39.271
11
94.737
78
94.737
78
1741.6
71
1741.6
71
1741.6
71

( xx )

(
y
y )
1 =

0 = y - 1 x

2645.466667
7838.933

0.337

18.133 (0.337 x 22.2667) = 10.618

Sehingga persamaan regresinya adalah :


^y = 0+ 1 X =10,618+0,337 X
Dengan menggunakan software MINITAB ternyata didapatkan juga
persamaan regresi yang sama yaitu sebagai berikut :
Regression Analysis: y versus x
The regression equation is
y = 10,6 + 0,337 x

Scatterplot of response vs doseLVL


35
30

response

25
20
15
10
5
0
0

10

20

30
40
doseLVL

50

60

70

c. Untuk mengetahui apakah lack of fit bermakna atau tidak bisa kita
lihat melalui scatterplot dari residual vs nilai dugaan ( ^y ). Dibawah
ini disajikan scatterplot yang menggunakan software MINITAB.
Versus Fits
(response is y)

Residual

-5

-10
10

15

20
25
Fitted Value

30

35

Dari scatterplot diatas, penulis mendiagnosa bahwa sebaran titik


tidak menyebar dan membentuk sebuah pola. Jika scatterplot
residual vs nilai dugaan ( ^y ) membentuk sebuah pola maka artinya
lack of fit bermakna. Namun kita ketahui persepsi setiap orang akan
berbeda beda maka dari itu di uji lack of fit untuk memastikan
kebenarannya dengan menggunakan software MINITAB.
Hipotesis

H0 : lack of fit tidak bermakna

H1 : lack of fit bermakna


Tingkat signifikansi = 0.05
Statistik uji : F
p-value < maka tolak H0.
Dengan menggunakan software MINITAB ternyata didapatkan hasil
sebagai berikut
Analysis of Variance
Source
Regression
Residual Error
Lack of Fit
Pure Error
Total

DF
1
13
4
9
14

SS
892,79
284,95
242,28
42,67
1177,73

Karena p-value =
fit bermakna.

0,001<

MS
892,79
21,92
60,57
4,74

F
40,73

P
0,000

12,78

0,001

0,05 maka gagal tolak H0 artinya lack of

a. Untuk menginterpretasikan nilai dibutuhkan nilai harapan


E() = 0 sehingga E(y) = 0 + 1X 1+ 1X 2+0 = 0 + 1X 1+ 1X 2
Metode 1
maka x1 = 0 dan x2 = 0 sehingga
E1 ( y )= 0 + 1(0)+ 1 (0)
E 1 ( y ) = 0
Metode 2
maka x1 = 1 dan x2 = 0 sehingga
E2 ( y )= 0 + 1(1)+ 1 (0)
E 2 ( y ) = 0 + 1
Metode 3
maka x1 = 0 dan x2 = 1 sehingga
E3 ( y )= 0 + 1(0)+ 1 (1)

E3 ( y )= 0 + 2
Jika, dimisalkan E1 ( y ) sebagai 1 ,
sebagai 3, maka diperoleh:
1= 0
2= 0 + 1=1 + 1
Sehingga diperoleh nilai s :
0=1
1=21

E2 ( y ) sebagai

2 dan

E3 ( y )

3= 0 + 2=1 + 2

2=31

b. Berdasarkan perhitunggan diatas, maka diperoleh perbedaan rata-rata metode 1 dan 2


sebagai berikut:
1= 0
2= 0 + 1
Sehingga perbedaan rataratametode 1dan metode 2adalah
12= 0 ( 0+ 1 ) =1

a. Dibawah ini disajikan scatterplot yang menggunakan software


MINITAB dari data yaitu dose FER versus additive

Scatterplot of FER vs Additive


5

FER

1
0

20

40

60

80

100

Additive

b. Dari plot diatas dapat kita lihat ternyata sebaran titik tidak linear (non linear) sehingga
regresi linear sederhana tidak dapat digunakan untuk data diatas. Dan dilihat dari
sebaran titiknya terlihat bahwa sebaran titik mendekati kurva kubik sehingga data
diatas akan lebih tepat digunakan jika menggunakan model regresi kubik.
c. Dibawah adalah output yang tersedia disoal (buku Brooks-Cole 2010 hal 732-733)

Berdasarkan output di atas, maka model regresi yang paling baik adalah model regresi
kubik, karena memiliki nilai korelasi (R2) dan R2 addjusted yang paling besar
dibanding model regresi linear dan kuadratik yaitu sebesar 0,9729 dan 0,9715.
Semakin tinggi nilai korelasi (R2) dan R2 addjusted artinya model yang didapat
semakin bagus. Selain itu RMSE model regresi kubik adalah yang paling kecil
dibanding model regresi linear dan kuadratik yaitu sebesar 0,17988. Semakin kecil
RMSE maka semakin baik pula modelnya.
d. Tidak karena data didapat dari penelitian.

a. Dengan bantuan software MINITAB didapat hasil sebagai berikut


Untuk model 1
Regression Analysis: y versus x1; x1^2; x2
The regression equation is
y = 1,64 + 0,00248 x1 + 0,000265 x1^2 + 0,000205 x2
Predictor
Constant
x1
x1^2
x2

Coef
1,6407
0,002483
0,00026522
0,0002050

S = 0,308659

SE Coef
0,2170
0,009303
0,00008930
0,0004455

R-Sq = 94,3%

T
7,56
0,27
2,97
0,46

P
0,000
0,796
0,018
0,658

R-Sq(adj) = 92,2%

Analysis of Variance
Source
Regression
Residual Error
Total
Source
x1
x1^2
x2

DF
1
1
1

DF
3
8
11

Seq SS
11,7786
0,8404
0,0202

SS
12,6392
0,7622
13,4013

MS
4,2131
0,0953

F
44,22

P
0,000

Model 2
Regression Analysis: y versus x1; x1^2; x2; x1x2; x1^2x2
The regression equation is
y = 1,66 + 0,0027 x1 + 0,000258 x1^2 + 0,00012 x2 - 0,000001 x1x2
+ 0,000000 x1^2x2
Predictor
Constant
x1
x1^2
x2
x1x2
x1^2x2

Coef
1,6586
0,00267
0,0002579
0,000116
-0,00000091
0,00000004

S = 0,355249

SE Coef
0,3220
0,01514
0,0001454
0,001138
0,00005354
0,00000051

R-Sq = 94,3%

T
5,15
0,18
1,77
0,10
-0,02
0,07

P
0,002
0,866
0,126
0,922
0,987
0,945

R-Sq(adj) = 89,6%

Analysis of Variance
Source
Regression
Residual Error
Total
Source
x1
x1^2
x2
x1x2
x1^2x2

DF
1
1
1
1
1

DF
5
6
11

SS
12,6441
0,7572
13,4013

MS
2,5288
0,1262

F
20,04

P
0,001

Seq SS
11,7786
0,8404
0,0202
0,0043
0,0006

dari hasil diatas dapat kita rangkum sebagai berikut

S
R-sq
Rsq(adj)
MSE

model
1
0,3086
59
94,3%

model
2
0,3552
49
94,3%

92,2%
0,0953

89,6%
0,1262

Untuk menentukan model yang terbaik dilihat dari R-sq dan R-sq yang paling tinggi
karena semakin tinggi semakin bagus x dalam menjelaskan y sehingga model mnjadi
lebih baik. Dari hasil diatas ternyata yg memiliki R-sq dan R-sq aj tinggi adalah
model 1. Selain itu dapat dilihat dari S yang terkecil karena semakin kecil artinya
ragamnya juga akan semakin kecil. Dan juga dilihat dari MSE paling kecil, karena
semakin kecil MSE artinya dugaan semakin mendekati data aslinya. Dari hasil
ternyata yg memiliki S dan MSE kecil adalah model 1. Maka dapat disimpulkan
model 1 adalah model yang terbaik
b. Persamaan regresi dari model yang terbaik yaitu model 1 adalah sebagai berikut
Regression Analysis: y versus x1; x1^2; x2

The regression equation is


y = 1,64 + 0,00248 x1 + 0,000265 x1^2 + 0,000205 x2
y = 1,64 + 0,00248 additive + 0,000265 additive^2 + 0,000205 cooper level
c.

Nilai 1 di persamaan regresi diatas artinya perubahan rataan Feed


efficiency ratio sebesar 0,00248 jika amount of additive naik satu
satuan

You might also like