You are on page 1of 83

STATISTIKA

PENGERTIAN Deskriptif: Metode untuk


mendeskripsikan, menggambarkan,
Statistika
menjabarkan, atau menguraikan data
Ilmu tentang pengumpulan data
Inferensia: Penarikan kesimpulan dari
Klasifikasi Data
sample untuk menjelaskan isi dari
Penyajian Data
populasi
Pengolahan Data
Penarikan Kesimpulan
Pengambilan keputusan JENIS JENIS DATA
Populasi: Himpunan keseluruhan dari Data mentah
objek pengamatan Data primer
Sample: Bagian dari populasi Data sekunder
Data: Informasi atau fakta yang Data Kuantitatif
tertuang dalam angka atau bukan Data Diskrit
angka
Data Kontinyu
Data Diskrit:
o Data Nominal Civitas UMMI
o Daata Ordinal Dosen

o Data Dikotomi Mahasis


wa
o Data Kualitatif
Pega
o Parameter: Kualitas Pengukuran wai
sample

CONTOH CONTOH sample


Populasi
Deskriptif
Nilai UAS mahasiswa Teknik Informatika Data Nominal
semester 4 untuk mata kuliah Statistika adalah Jumlah lulusan mahasiswa Universitas
dengan nilai rata rata 65 Muhammadiyah Sukabumi tahun 2008
Populasi dan Sample Program Studi Jumlah
Civitas akademik Universitas Muhammadiyah l Teknik Informatik 25 orang
Sukabumi terdiri dari dosen, mahasiswa dan
Kimia 5 orang
staff pekerja lainnya yang berjumlah 1200
orang SDPK 4 orang
Data Ordinal
Kategori hasil nilai akhir Mata Kuliah
Statistika
Kategori Nilai Jumlah
Istimewa 10 orang
Baik 12 orang
Cukup 20 orang
Kurang 7 orang
Kurang sekali 3 orang

Data Dikotomi
Murni: Hidup mati, surga neraka,
laki laki wanita, dll.
Buatan: lulus gagal, hitam putih,
dll.
Data interval: data yang memiliki
rentang atau jarak yang sama
Data rasio: Data yang dinyatakan
dalam perbandingan
TENDENSI SENTRAL
Nilai rata rata (Mean): Nilai Tengah (Median):
Rumus:
Rumus:
Biasa
Biasa

Dengan Frekuensi
Dengan Frekuensi

Keterangan:
Keterangan:
(jumlah data ke 1
sampai data ke-n ) Me = median
Lo = Batas bawah kelas
C = lebar kelas
(jumlah perkalian frekuensi dengan data) n = banyaknya data
n = banyaknya data F = jumlah frekuensi sebelum kelas
= jumlah frekuensi f = jumlah frekuensi kelas
Modus = Nilai yang paling Contoh Kasus:
1. Data hasil ujian akhir semester 4 untuk mata
sering muncul kuliah statistika adalah sebagai berikut: 40, 65,
Biasa 90, 65, 70, 55, 85, 65, 70, 35
Tentukanlah:
Mo = nilai yang paling sering a. Rata rata nilai UAS
muncul b. Modus nilai UAS
Data berfrekuensi c. Median Nilai UAS
2. Data nilai UAS mahasiswa semester 4, untuk
mata kuliah STATISTIKA adalah sebagai berikut:

Nilai Jml Mhs


45 6
Keterangan: 50 8
Mo = modus
65 14
Lo = Batas bawah kelas modus
70 16
C = lebar kelas
75 9
b1 = selisih frekuensi sebelum kelas
modus 80 4
b2 = selisih frekuensi tepat satu data
setelahnya Tentukanlah nilai :
a. Rata2
b. Modus
c. Median
Contoh soal data distribusi
berfrekuensi
Misalkan modal (dalam jutaan rupiah) dari 40
perusahaan pada tabel distribusi frekuensi
berikut:
Modal Frekuensi

112 - 120 4 Tentukan:


a. Mean/ Rata rata
121 - 129 5 b. Median
130 - 138 8 c. Modus
139 - 147 12
148 -156 5
157 -165 4
166 - 174 2
= 40
Kata Kunci
Data Distribusi Frekuensi
Kelas = selang/ interval Batas bawah kelas dan
Frekuensi = banyaknya batas atas kelas
nilai yang termasuk ke Lebar kelas= selisih
dalam kelas batas atas kelas dan
Limit kelas/ tepi kelas: batas bawah kelas
Nilai terkecil dan Nilai tengah kelas =
terbesar pada setiap (batas bawah kelas +
kelas, terbagi menjadi 2, batas atas kelas)/ 2
yaitu limit bawah kelas
dan limit atas kelas
Dari contoh di atas, maka didapat:
Kelas = 112 120 Lebar kelas= 120,5
Limit kelas/ tepi kelas: 111,5 = 9 nilai lebar
pada kelas 112 120, kelas pada masing
Nilai 112 disebut limit masing kelas adalah
bawah kelas dan nilai sama
120 disebut limit atas Nilai tengah kelas =
kelas (111,5 + 120,5)/2 = 116
Pada kelas 112 120,
nilai 111,5 disebut
batas bawah kelas dan
nilai 120,5 disebut
batas atas kelas
Penyelesaian Soal
Mean/ Rata - rata
Nilai Tengah Frekuensi
Modal fX
(X) (f)
112 - 120 116 4 464
121 - 129 125 5 625
130 - 138 134 8 1.072
5.621
139 - 147 143 12 1.716 X 140,525
40
148 -156 152 5 760
157 -165 161 4 644
166 - 174 170 2 340
= 40 = 5.621
MEDIAN
n
2F
Med L0 c
f

Untuk mencari median, tentukan dulu pada kelas interval
mana mediannya terletak.
Karena frekuensinya bernilai genap, maka median terletak
pada nilai ke n 1 40 1
20,5
2 2
Data ke 20,5 terletak pada kelas interval 139 147. Maka
diperoleh:
Lo = 138,5 f = 12 F = 4 + 5 + 8 = 17
c = 147,5 138,5 = 9
Jadi mediannya adalah
40
17
Med 138, 5 9 2
12

20 17
Med 138,5 9 140, 75
12

MODUS
Untuk mencari modus, tentukan dulu kelas interval yang
mengandung modus, yaitu kelas interval yang memiliki
frekuensi terbesar. Maka dapat diketahui bahwa modus
terletak pada kelas interval 139 147
Dengan demikian:
Lo = 138, 5 c=9 b1 = 12-8=4
b2 = 12-5=7

Jadi modusnya adalah:

b1 4
Mod L0 c 138,5 9
b1 b2 47

= 138,5 + 3,27 = 141,77


KUARTIL, DESIL, DAN PERSENTIL
KUARTIL (Perluasan Median)
Kuartil terbagi menjadi 3, yaitu:
Kuartil pertama/ Kuartil bawah (Q1)
Kuartil kedua/ Kuartil tengah (Q2)
Kuartil ketiga/ Kuartil atas (Q3)

Rumus Untuk data tidak berkelompok:

i (n 1)
Qi Nilaiyangke i 1, 2,3
4
Untuk data berkelompok

i, n Dimana:
4 F Lo= Batas bawah kelas kuartil
Qi L0 c , i 1, 2,3 c = Lebar kelas
f F = Jumlah frekuensi semua kelas
sebelum kelas kuartil Qi
f = Frekuensi kelas kuartil Qi

DESIL
Jika sekelompok data dibagi menjadi 10 bagian yang
sama banyak, maka akan terdapat 9 pembagi, masing
masing disebut nilai Desil (D), yaitu D1, D2, , D9
Untuk data tidak berkelompok
i (n 1)
Di nilaiyangke , i 1, 2,3,...,9
10
Untuk data berkelompok
i.n
10 F
Di L0 c , i 1, 2,3,...,9
f

Dimana: Lo = Batas bawah kelas desil Di
c = Lebar kelas
F = Jumlah frekuensi semua kelas sebelum kelas desil Di
f = Frekuensi kelas desil Di
PERSENTIL
Jika sekelompok data dibagi menjadi 100 bagian
sama banyak, maka akan terdapat 99 pembagi, yang
masing masing disebut persentil (P), yaitu
P1,P2,P3,,P99. Nilai persentil ke-I, yaitu Pi dihitung
dengan rumus berikut.

Untuk data tidak berkelompok:


i (n 1)
Pi nilaike , i 1, 2,3,...,99
100
Untuk data berkelompok

i.n
100 F
Pi L0 c , i 1, 2,3,...,99
f

Dimana: Lo = Batas bawah kelas persentil Pi
c = Lebar kelas
F = Jumlah frekuensi semua kelas sebelum kelas persentil Pi
f = Frekuensi kelas persentil Pi
Contoh soal data tidak berkelompok
Tentukan kuartil Q1, Q2 dan Q3 dari data gaji bulanan 13
karyawan (dalam ribuan rupiah) berikut.
40, 30, 50, 65, 45, 55, 70, 60, 80, 35, 85, 95, 100.
Jawab:
Urutan data: 30, 35, 40, 45, 50, 55, 60, 65, 75, 80, 85, 95, 100.
Maka: i (n 1)
Qi nilaike , n 13
4
1(13 1) 1
Q1=nilai ke- 4 nilai ke- 3
2
= antara nilai ke 3 dan ke 4
= nilai ke 3 + (nilai ke 4 nilai ke 3)
= 40 + (45-40)
= 40 + 2,5= 42,5
Tentukan desil D3 dan D7 dari data gaji bulanan 13 karyawan
(dalam ribuan rupiah) berikut.
40, 30, 50, 65, 45, 55, 70, 60, 80, 35, 85, 95, 100.
Jawab:
Urutan data: 30, 35, 40, 45, 50, 55, 60, 65, 75, 80, 85, 95, 100.
i (n 1)
Di nilaiyangke
10
Maka:
3(13 1)
D3= nilai yang ke-
1 10
= nilai ke 4 5
= nilai ke 4 + 1/5 (nilai ke 5 nilai ke 4)
= 45 + 1/5 (50-45)
= 45 + 1= 46
Contoh soal data berkelompok
Misalkan modal (dalam jutaan rupiah) dari 40
perusahaan pada tabel distribusi frekuensi
berikut: Modal Frekuensi Tentukan:
a. Tentukan nilai kuartil
112 - 120 4 Q1, Q2 dan Q3
121 - 129 5 b. Tentukan desil D3 dan D8
c. Tentukan persentil P20
130 - 138 8 dan P 80
139 - 147 12
148 -156 5
157 -165 4
166 - 174 2
= 40
Penyelesaian Soal
Mencari Q1, Q2, dan Q3
Jawab:
Tentukan dulu kelas interval Q1, Q2, dan Q3
Karena n=40,
Q1 terletak pada nilai ke 1(40 1) 10, 25
4
Nilai ke 10, 25 terletak pada interval kelas 130 138
Q2 terletak pada nilai ke 2(40 1) 20,5
4
Nilai ke 20, 5 terletak pada interval kelas 139 147
Q3 terletak pada nilai ke 3(40 1) 30, 75
4
Nilai ke 30,75 terletak pada interval kelas 148 156
Setelah diketahui interval kelas dari tiap tiap kuartil yang
dicari, maka nilai kuartil dapat dicari dengan rumus.
i, n
4 F
Qi L0 c
f

Untuk Q1, terletak pada interval kelas 130 137, maka:


Lo = 129,5 F = 4+5 = 9 f=8 c=9
sehingga:
40
4 9 10 9
Q1 129,5 9 129,5 9 130, 625
8 8

Mencari D3 dan D8
Jawab:
Tentukan kelas interval dimana desil berada
Karena n = 40, maka kelas interval D3 dan D8 berada pada:
D3 terletak pada nilai ke 3(40 1) 12,3
10
Nilai ke 12,3 terletak pada interval kelas 130 138
D8 terletak pada nilai ke 8(40 1) 32,8
10
Nilai ke 32,8 terletak pada interval kelas 139 147
Maka nilai D3 dan D8 adalah:

i.n
10 F
Di L0 c
f

Untuk D3 terletak pada interval kelas 130 138, maka:
Lo = 129,5 F = 4+5= 9 f=8 c=9
Sehingga:

3(40)
10 9 12 9
D3 129,5 9 129,5 9 132,875
8 8

PENGUKURAN DISPERSI, KEMIRINGAN,
DAN KERUNCINGAN DATA
DISPERSI DATA
Dispersi/ variasi/ keragaman data: ukuran penyebaran suatu
kelompok data terhadap pusat data.
Ukuran Dispersi yang akan dipelajari:
Jangkauan (Range)
Simpangan rata rata (mean deviation)
Variansi (variance) Dispersi multak

Standar Deviasi (Standard Deviation)


Simpangan Kuartil (quartile deviation)
Koefisien variasi (coeficient of variation) Dispersi relatif
RANGE/ JANGKAUAN DATA (r)
Range: Selisih nilai maksimum dan nilai minimum
Rumus:
Range (r) = Nilai max nilai min
Range untuk kelompok data dalam bentuk distribusi
frekuensi diambil dari selisih antara nilai tengah kelas
maksimun nilai tengah kelas minimum
Simpangan Rata2/ Mean Deviation
(SR)
Simpangan rata rata: jumlah nilai mutlak dari selisih
semua nilai dengan nilai rata rata, dibagi banyaknya
data.
Rumus
Untuk data tidak berkelompok

X X
Dimana:
X = nilai data

SR X = rata rata hitung


n = banyaknya data
n
Untuk data berkelompok
Dimana:
( f X X ) X = nilai data

SR
X = rata rata hitung
n = f = jumlah frekuensi

n
2
VARIANSI/ VARIANCE ( s )
Variansi adalah rata rata kuadrat selisih atau
kuadrat simpangan dari semua nilai data terhadap
rata rata hitung.
2
s = simbol untuk sample

2
= simbol untuk populasi
Rumus untuk data tidak berkelompok

X X
2

S
2

n 1
Untuk data berkelompok

f X X
2

S
2

n 1
STANDAR DEVIASI/ STANDARD
DEVIATION (S)
Standar deviasi: akar pangkat dua dari variansi
Rumus:
Untuk data tidak berkelompok
X X
2

S
2

n 1
Untuk data berkelompok

f X X
2

S
2

n 1
Contoh Soal
Data tidak berkelompok
Diketahui sebuah data berikut:
20, 50, 30, 70, 80
Tentukanlah:
a. Range (r)
b. Simpangan Rata rata (SR)
c. Variansi
d. Standar Deviasai
Jawab:
a. Range (r) = nilai terbesar nilai terkecil = 80 20 = 60
b. Simpangan Rata rata (SR):
X X
SR
n
20 50 30 70 80
X 50
5

n=5
20 50 50 50 30 50 70 50 80 50
SR
5
30 0 20 20 30 100
SR 20
5 5
2
Variansi ( s )
X X
2

S
2

n 1

(20 50) 2
(50 50) 2
(30 50) 2
(70 50) 2
(80 50) 2
S2
5 1
900 0 400 400 900 2600
S2 650
4 4

Standar Deviasi (S)

S S 2

S 650 25, 495


Contoh Soal
Data Berkelompok
Diketahui data pada tabel dibawah ini:

Modal Frekuensi Tentukan:


a. Range (r)
112 - 120 4 b. Simpangan rata rata (SR)
121 - 129 5 c. Variansi
d. Standar Deviasi
130 - 138 8
139 - 147 12
148 -156 5
157 -165 4
166 - 174 2
40
JAWAB
Range (r)= (nilai tengah tertinggi nilai tengah terendah)/2
Simpangan rata rata
( f X X )
SR
n
n = jml frekuensi
Variansi
f X X
2

S
2

n 1
Standar Deviasi
f X X
2

S
2

n 1
Untuk memudahkan mencari jawaban, maka dibuat tabel
sesuai dengan keperluan jawaban
Nilai
Modal f Tengah X X f X X ( X X )2 f ( X X )2
(X)
112 - 120 4 116 24,525 98,100 601,476 2405,902
121 - 129 5 125 15,525 77,625 241,026 1205,128
130 - 138 8 134 6,525 52,200 42,576 340,605
139 - 147 12 143 2,475 29,700 6,126 73,507
148 -156 5 152 11,475 57,375 131,676 658,378
157 -165 4 161 20,475 81,900 419,226 1676,902
166 - 174 2 170 29,475 58,950 868,776 1737,551
Jumlah 40 455,850 8097,974
Maka dapat dijawab:
Range (r) = 170 116 = 54
Simpangan rata rata
455,850
SR 11,396
40
Variansi
8097,974 8097,974
S
2
207, 64
40 1 39
Standar Deviasi
S 207, 64 14, 41
JANGKAUAN QUARTIL
DAN JANGKAUAN PERSENTIL 10-90
Jangkauan kuartil disebut juga simpangan kuartil, rentang
semi antar kuartil, deviasi kuartil. Jangkauan persentil 10-90
disebut juga rentang persentil 10-90
Jangkauan kuartil dan jangkauan persentil lebih baik daripada
jangkauan (range) yang memakai selisih antara nilai
maksimum dan nilai minimun suatu kelompok data
Rumus:
Jangkauan Kuartil:
1 Ket:
JK (Q3 Q1 ) JK: jangkauan kuartil
Q1: kuartil bawah/ pertama
2 Q3: kuartil atas/ ketiga
Rumus Jangkauan Persentil

JP1090 P90 P10


KOEFISIEN VARIASI/ DISPERSI RELATIF
Untuk mengatasi dispersi data yang sifatnya mutlak, seperti
simpangan baku, variansi, standar deviasi, jangkauan kuartil,dll
Untuk membandingkan variasi antara nilai nilai bersar dengan nilai
nilai kecil.
Untuk mengatasi jangkauan data yang lebih dari 2 kelompok data.

Rumus:
Ket:
S KV: Koefisien variasi
KV *100% S : Standar deviasi
X X : Rata rata hitung
KOEFISIEN VARIASI KUARTIL
Alternatif lain untuk dispersi relatif yang bisa digunakan jika
suatu kelompok data tidak diketahui nilai rata rata hitungnya
dan nilai standar deviasinya.
Rumus:

Q3 Q1 (Q3 Q1 ) / 2
KVQ atau KVQ
Q3 Q1 Med
NILAI BAKU
Nilai baku atau skor baku adalah hasil transformasi antara nilai
rata rata hitung dengan standar deviasi
Rumus:

X1 X Nilai i = 1, 2, 3, , n
Zi
S
Contoh Soal untuk Koefisien Variasi dan
Simpangan Baku
Koefisien Variasi
Ada dua jenis bola lampu. Lampu jenis A secara rata rata
mampu menyala selama 1500 jam dengan simpangan baku
(standar deviasi) S1 = 275 jam, sedangkan lampu jenis B
secara rata rata dapat menyala selama 1.750 jam dengan
simpangan baku S2 = 300 jam. Lampu mana yang kualitasnya
paling baik?
Jawab: S1 275
KV *100% *100% 18,3%
Lampu jenis A: 1 X 1 1500

Lampu jenis B: KV2 S2 *100% 300 *100% 17,1%


X2 1750
Nilai rata rata ujian akhir semester mata kuliah Statistika
dengan 45 mahasiswa adalah 78 dan simpangan baku/standar
deviasi (S) = 10. Sedangkan untuk mata kuliah Bahasa Inggris
di Kelas itu mempunyai nilai rata rata 84 dan simpangan
bakunya (S) = 18. Bila dikelas itu, Desi mendapat nilai UAS
untuk kalkulus adalah 86 dan untuk bahasa Inggris adalah 92,
bagaimana posisi/ prestasi Desi di kelas itu?
Jawab
Untuk mengetahui posisi/ prestasi Desi, maka harus dicari
nilai baku (Z) dari kedua mata kuliah tersebut.
X X
Z
S
dengan nilai X adalah nilai UAS yang diperoleh Desi
Untuk Mata Kuliah Statistika
X = 86 S = 10
X 78
Maka:
86 78
Z 0,8
10
Untuk Mata Kuliah Bahasa Inggris
X = 92 S = 18
X 84
Maka:
92 84
Z 0, 4
18
Karena nilai baku (Z) untuk mata kuliah Statistika
lebih besar dari B. Inggris, maka posisi Desi lebih baik
pada mata kuliah Statistika dari pada B. Inggris
KEMIRINGAN DATA
Kemiringan: derajat/ ukuran dari
ketidaksimetrian (asimetri) suatu distribusi
data
3 pola kemiringan distribusi data, sbb:
Distribusi simetri (kemiringan 0)
Distribusi miring ke kiri (kemiringan negatif)
Distribusi miring ke kanan (kemiringan positif)
Beberapa metoda yang bisa dipakai untuk
menghitung kemiringan data, yaitu:
Rumus Pearson
Rumus Momen
Rumus Bowley
Rumus Pearson ()
X Mod 3( X Med )
atau
S S
Rumus tersebut dipakai untuk data tidak
berkelompok maupun data berkelompok.
Bila = 0 atau mendekati nol, maka dikatakan
distribusi data simetri.
Bila bertanda negatif, maka dikatakan distribusi
data miring ke kiri.
Bila bertanda positif, maka dikatakan distribusi
data miring ke kanan.
Semakin besar , maka distribusi data akan
semakin miring atau tidak simetri
RUMUS MOMEN ( 3 )
Cara lain yang dipakai untuk menghitung
derajat kemiringan adalah rumus momen
derajat tiga, yaitu
Untuk data tidak berkelompok:

3
(X X ) 3

3
nS
Untuk data berkelompok
3 ( f ( X X ) 3
)
f S 3
Khusus untuk data berkelompok dalam bentuk
tabel distribusi frekuensi , derajat kemiringan
3 dapat dihitung dengan cara transformasi
sebabai berikut:

c
fU fU
3
3
fU 3
fU 2

3 3 3

n 2
S n n n

Jika 3 = 0, maka distribusi data simetri


Jika 3 < 0, maka distribusi data miring ke kiri
Jika 3 > 0, maka distribusi data miring ke kanan
Untuk mencari nilai Standar deviasi (S)
menggunakan variabel U:

2
n fU ( fU )
2

S c
n(n 1)

Variabel U = 0, 1, 2, 3, dst.
RUMUS BOWLEY
Q3 Q1 Q2

Q3 Q1
KERUNCINGAN DISTRIBUSI DATA
Keruncingan distribusi data adalah derajat
atau ukuran tinggi rendahnya puncak suatu
distribusi data terhadap distribusi normalnya.
Keruncingan data disebut juga kurtosis, ada 3
jenis yaitu:
Leptokurtis
Mesokurtis
Platikurtis
KERUNCINGAN DISTRIBUSI DATA
Keruncingan distribusi data (4) dihitung
dengan rumus:
Data tidak berkelompok

4
(X X ) 4

4
nS
Data Berkelompok

4
( f (X X ) ) 4

f *S 4
Khusus untuk transformasi
4
c fU
4
fU fU fU fU fU
3 2 2 4

4 4 4



6



3
S n n n n n n

Keterangan
4 = 3, distribusi data mesokurtis
4 > 3, distribusi data leptokurtis
4 < 3, distribusi data platikurtis
Selain cara di atas, untuk mencari keruncingan
data, dapat dicari dengan menggunakan
rumus:
1 K= Koefisien Kurtorsis Persentil
(Q3 Q1 )
JK
K 2
P90 P10 P90 P10

Keterangan
K = 0,263 maka keruncingan distribusi data mesokurtis
K > 0,263 maka keruncingan distribusi data leptokurtis
K < 0,263 maka keruncingan distribusi data platikurtis
REGRESI DAN KORELASI
Pada bab ini akan membahas dua bagian yang
saling berhubungan, khususnya dua kejadian
yang dapat diukur secara matematis.
Dalam hal dua kejadian yang saling
berhubungan, ada dua hal yang perlu diukur
dan dianalisis, yaitu:
Bagaimana hubungan fungsional (persamaan matematis)
antara dua kejadian tersebut -> analisis regresi
Bagaimana kekuatan (keeratan) hubungan dua kejadian itu
-> analisis korelasi
REGRESI LINEAR SEDERHANA
Garis regresi/ regresi: garis lurus/ garis linear
yang merupakan garis taksiran atau perkiraan
untuk mewakili pola hubungan antara variabel
X dan variabel Y.
Cara untuk mencari persamaan garis regresi:
Dimana
^
Y a bX
Y = variabel terikat
X = variabel bebas
a = intersep (pintasan) bilamana X=0
b = koefisien arah (slope) dari garis regresi
Koefisien regresi a dan b dapat dicari dengan
rumus:

a
Y . X X . XY
2

n. X ( X )
2 2

n. XY X . Y
b
n. X ( X )
2 2
Rumus lain untuk menghitung koefisien a dan b
adalah:
n. XY X . Y
b
n. X ( X )
2 2

a
Y X
b
n n

Kita dapat membuat garis regresi lebih dari
satu dari suatu data. Lalu garis regresi
manakah yang paling baik??
Garis regresi yang paling baik adalah garis
regresi yang mempunyai total kuadrat
kesalahan/ total kuadrat selisih/ total kuadrat
eror yang paling minimum.
Total kuadrat eror dapat dihitung dengan:
^
e 2


(Y Y ) 2

n n
Selanjutnya bila diambil akarnya,
maka diperoleh:
^ Bentuk terakhir ini disebut

S^
(Y Y ) 2 Kesalahan baku dari penafsiran
Atau disebut juga
Standard error of estimate
yx n

Rumus di atas dapat di jabarkan menjadi:

S^
Y 2
a. Y b. XY
yx n
Nih.. Contoh Soal Regresi
Berat 2 3 4 5 6 7 8
Badan
Tinggi 4 5 2 3 9 6 7
Badan

Tentukanlah persamaan regresi dan kesalahan baku penafsirannya!


Jawab: ^
Persamaan regresi adalah: Y a bX
Untuk melengkapi persamaan tersebut, maka perlu dicari nilai a dan b.
Cara mencari nilai a dan b adalah:

Y . X X . XY
2
n. XY X . Y
a b
n. X ( X )
2 2
n. X 2 ( X )2
Untuk mempermudah mencari nilai nilai yang
diperlukan, maka akan digunakan tabel.
Berat 2 3 4 5 6 7 8 X = 35
Badan (X) = 1225
(X)
Tinggi 4 5 2 3 9 6 7 Y = 36
Badan
(Y)
X 4 9 16 25 36 49 64 X = 203
XY 8 15 8 15 54 42 56 XY = 198

Masukan nilai nilai yang telah diketahui,


ke dalam rumus untuk mencari nilai a dan b:

36* 203 35*198 7308 6930 378


a 1,93
7 * 203 1225 1421 1225 196
7 *198 35*36 1386 1260 126
b 0, 64
7 * 203 1225 1421 1225 196
Setelah diketahui, nilai a dan b, maka masukan nilai a dan b
ke dalam persamaan regresi. Hasilnya adalah:
Ini persamaan regresi /
^
Y 1,93 0, 64 X
hubungan dari variabel
X dan Y tadi. Ngerti
kan????
b. Mencari nilai kesalahan baku dari penafsiran.

S^
(Y Y ) 2

yx n
Masukan nilai X ke dalam persamaan regresi untuk
mencari nilai Y regresi
Berat 2 3 4 5 6 7 8
Badan
(X)
Tinggi 4 5 2 3 9 6 7
Badan
(Y)

^ 3.21 3,85 4,49 5,13 5,77 6,41 7,05


Y
^ 0,79 1,15 -2,49 -2,13 3,33 -0,41 -0,05
Y Y
0,6241 1,3225 6,2001 4,5369 11,0889 0,1681 0,0025 ^
(Y Y )2
^
(Y Y ) 2
23,9431

Cara mencari nilai Y regresi, masukan nilai masing masing X ke dalam


persamaan regresi. ^
Y 1,93 0, 64 X
^
X 1 = 2 -> Y1 1,93 0, 64* 2 1,93 1, 28 3, 21
^
X 2 = 3 -> Y2 1,93 0, 64*3 1,93 1,92 3,85
^
X 3 = 4 -> Y3 1,93 0, 64* 4 1,93 2,56 4, 49

^
X 4 = 5 -> Y4 1,93 0, 64*5 1,93 3, 2 5,13
^
X 5 = 6 -> Y5 1,93 0, 64*6 1,93 3,84 5, 77
^
X 6 = 7 -> Y6 1,93 0, 64*7 1,93 4, 48 6, 41
^
X 7 = 8 -> Y7 1,93 0, 64*8 1,93 5,12 7, 05
Maka nilai kesalahan baku dari taksiran regresi
adalah:
Akhirnya.
Terjawab
^

semuanya.
(Y Y ) 2
23,9431 Mudah kan? ^^
S^ 1,85
yx n 7

Perlu diketahui, bahwa selain regresi linear, dikenal juga regresi yang bukan
linear, yaitu:
1. Parabola kuadrat
2. Parabola kubik Sekedar buat
3. Eksponen pengetahuan aja,,, ga
4. Geometrik dipelajari di bab ini..
5. Logistik Tapi kalo mau,,
6. Hiperbola otodidak aja ya
7. Gompertz
KOEFISIEN KORELASI
Perumusan koefisien korelasi dilakukan
dengan memakai perbandingan antara variasi
yang dijelaskan dengan variasi total.
Variasi total dari Y terhadap Y dirumuskan
oleh 2
(Y Y )
^ ^

(Y Y ) (Y Y ) (Y Y )
2 2 2

Variasi yang tidak Variasi yang


dijelaskan dijelaskan
Perbandingan antara variasi yang dijelaskan
dengan variasi total, yaitu:
^ 2

r2
(Y Y ) 2 r adalah koefisien determinasi

(Y Y ) 2

Koefisien korelasi (r) adalah akar dari koefisien


determinasi
^ Rumus r

r
(Y Y ) 2 pertama

(Y Y ) 2
Keterangan:
1. Nilai r = -1 disebut korelasi linear negatif
(berlawanan arah); artinya terdapat hubungan
negatif yang sempurna antara variabel X dan Y
2. Nilai r = 1 disebut korelasi linear positif (searah);
artinya terdapat hubungan positif yang sempurna
antara variable X dengan variabel Y
3. Nilai r = 0 disebut tidak berkorelasi secara linear,
artinya tidak ada hubungan antara variabel X dan Y
Koefisien korelasi dapat juga dicari dengan
rumus berikut:
Dimana:
2
S^ S ^2 = kuadrat dari kesalahan baku
r 1 y.x y .x
Rumus r
S 2 kedua 2 (Y Y ) 2

y S y = variansi Y
n

Kedua rumus koefisien korelasi di atas, dapat digunakan untuk mengukur


kekuatan hubungan yang bentuknya linear maupun tidak linear. Bila hubungan
antara variabel X dan Y bentuknya linear, maka rumus pertama dapat diubah
menjadi:

xy xX X
Dimana:

r
( x )( y2 2
) y Y Y
Disebut juga koefisien korelasi
produk momen
Dari rumus terakhir, yaitu koefisien korelasi
produk momen (product momen formula)
Apabila kita ambil:
S xy
xy Merupakan kovarians dari X dan Y
n

Sx
x 2
Merupakan simpangan baku dari X
n

Sy
y 2
Merupakan simpangan baku dari Y
n
S y2 Merupakan variansi dari Y

S x2 Merupakan variansi dari X


Dengan demikian, maka rumus koefisien
korelasi dapat juga ditulis:
Gmana???
S xy Bingung rumus mana yang
r harus digunakan???
Ga usah khawatir
Sx S y sesuaikan aja sama data
yang diketahui.. OK?!!

n. XY X . Y
r

n. X 2
(
X ) 2
n. Y 2
(
Y ) 2
Arti dari koefisien korelasi r adalah:
1. Bila 0,90 < r < 1,00 atau -1,00 < r < -0,90:
artinya hubungan yang sangat kuat
2. Bila 0,70 < r < 0,90 atau -0,90 < r < -0,70:
artinya hubungan yang kuat
3. Bila 0,50 < r < 0,70 atau -0,70 < r < -0,50:
artinya hubungan yang moderat
4. Bila 0,30 < r < 0,50 atau -0,50 < r < -0,30:
artinya hubungan yang lemah
5. Bila 0,0 < r < 0,30 atau -0,30 < r < 0,0: artinya
hubungan yang sangat lemah
Contoh soalnya nih.
Biar lebih ngerti.
Soalnya sama aja dengan yang regresi ya.
Berat 2 3 4 5 6 7 8
Badan
Tinggi 4 5 2 3 9 6 7
Badan

Tentukanlah:
1. Koefisien korelasi (r) dan artinya
2. Koefisien determinasi dan artinya
Jawab:
Berat 2 3 4 5 6 7 8 X = 35
Badan (X) = 1225
(X)
Tinggi 4 5 2 3 9 6 7 Y = 36
Badan (Y) = 1296
(Y)
X 4 9 16 25 36 49 64 X = 203

XY 8 15 8 15 54 42 56 XY = 198

Y 16 25 4 9 81 36 49 Y = 220

Koefisien korelasi adalah:


n. XY X . Y
r
n. X 2
( X )2 n. Y 2 ( Y )2

7*198 35*36
r
7*203 12257*220 1296
Truz.
1368 1260
r
1421 12251540 1296
108
r
196* 244
108
r
47824

108 108
r 0, 49
47824 218, 69
Kesimpulannya.????
Oleh karena, nilai r = 0,49 terletak antara 0,30
dan 0,50 maka terdapat hubungan positif yang
lemah antara tinggi badan dan berat badan.

Koefisien determinasi, yaitu


r (0, 49) 0, 2401
2 2

Artinya, variasi tinggi badan yang dapat dijelaskan oleh variasi berat badan (X)
Mahasiswa oleh persamaan regresi ^ adalah
Y 1,93 0, 64 X
Sebesar 24,01 %. Sisanya 75,99% dipengaruhi oleh faktor lain.
TUGAS 2
Data pada suatu pabrik kertas menunjukkan
bahwa banyaknya mesin yang rusak ada
hubungannya dengan kecepatan beroperasi
mesin cetak. Tergambar pada tabel di bawah
ini.
Kecepatan mesin 8 9 10 11 12 13 15 16
permenit
Jumlah kerusakan 6 7 8 5 7 10 12 9
kertas (lembar)
Tentukanlah:
1. Persamaan regresi linear
2. Berapa perkiraan jumlah kertas yang rusak, jika
kecepatan mesin permenit adalah 18?
3. Tentukan kesalahan baku yang diberikan oleh
persamaan regresi!
4. Tentukanlah koefisien korelasi dan koefisien
determinasi data tersebut serta berikan artinya
masing masing!
Deadline
Next week
Dont be late
OK!!!!
STATISTIKA SEMESTER 4
QUIZ 3
Selasa, 2 Juni 2009

Data pada suatu pabrik kertas menunjukkan bahwa


banyaknya mesin yang rusak ada hubungannya dengan
kecepatan beroperasi mesin cetak. Tergambar pada tabel di
bawah ini.

Kecepatan mesin 7 8 9 10 11 12 14 15
permenit
Jumlah kerusakan 5 6 7 4 6 9 11 8
kertas (lembar)

Tentukanlah:
1. Persamaan regresi linear
2. Berapa perkiraan jumlah kertas yang rusak, jika kecepatan
mesin permenit adalah 20?

You might also like