You are on page 1of 9

BENHARD HUTAURUK, 0910031802048

Implementasi K-Nearest Neighbor Termodifikasi Untuk Menentukan


Klasifikasi Lirik Lagu Berdasarkan Suasana Hati dibawah bimbingan Susanti,
M.IT
122 + ix hal/34 tabel/54 gambar/16 pustaka (1958-2014).

ABSTRAK

Lirik lagu merupakan sekumpulan teks yang mengandung makna suasana hati
tertentu, oleh karena itu lirik lagu dapat diklasifikasi berdasarkan suasana hati.
Jumlah lirik lagu yang besar dapat menjadi suatu masalah jika pengklasifikasian
lirik lagu dilakukan secara manual, hal ini dikarenakan jumlah lirik lagu yang
besar membutuhkan waktu yang banyak untuk melakukan klasifikasi satu per
satu. Oleh sebab itu dibutuhkan sebuah sistem yang dapat melakukan klasifikasi
lirik lagu sehingga pengguna dapat mengklasifikasi lirik serta mendapatkan lirik
lagu yang telah diklasifikasi sebelumnya. Berdasarkan masalah tersebut maka
dibuatlah sebuah aplikasi yang dapat digunakan untuk mengklasifikasi lirik lagu
dan menampilkan lirik-lirik sesuai dengan kelas suasana hati masing-masing.
Sistem yang dibangun menggunakan algoritma K-Nearest Neighbor termodifikasi
untuk mengklasifikasi dokumen teks lirik lagu. Tahapan dalam melakukan
klasifikasi yaitu dengan memilih salah satu dari data uji untuk kemudian diproses
melalui tahapan pemrosesan awal teks, tahapan pembobotan dengan metode TF-
IDF dan tahapan perhitungan kemiripan dokumen menggunakan metode Cosine
Similarity, selajutnya dilakukan pencarian probabilitas kelas terhadap lirik
tersebut menggunakan algoritma K-Nearest Neighbor termodifikasi. Nilai
probabilitas kelas tertinggi yang didapatkan merupakan kelas dari lirik lagu
tersebut. Dari hasil penelitian dilakukan evaluasi dan didapatkan nilai rata-rata
masing-masing yaitu Precision sebesar 0,85, Recall sebesar 0,80, Accuracy
sebesar 0,91 dan Fmeasure sebesar 0,81. Dari hasil evaluasi yang didapat,
disimpulkan sistem mampu mengelompokkan lirik lagu sesuai kelas suasana hati.

Kata kunci: K-Nearest Neighbor Termodifikasi, Lirik Lagu, Suasana Hati

i
KATA PENGANTAR

Dengan nama Tuhan Yang Maha Esa yang telah memberikan rahmat dan

karunia-Nya, sehingga penulis dapat menyelesaikan skripsi ini dengan judul

“Implementasi K-Nearest Neighbor Termodifikasi Untuk Menentukan

Klasifikasi Lirik Lagu Berdasarkan Suasana Hati”.

Dalam skripsi ini penulis banyak mengalami kesulitan, akan tetapi berkat

ketekunan, bimbingan dari dosen pembimbing serta dorongan dari teman-teman,

maka skripsi ini dapat diselesaikan. Oleh karena itu, pada kesempatan ini

perkenankanlah penulis mengucapkan terima kasih yang sebesar-besarnya kepada:

1. Bapak Prof. Dr. H. Dadang Iskandar M.Sc, Ketua Yayasan Komputasi Riau.

2. Bapak Johar Arif, S,Sos, MM, Ketua STMIK-AMIK Riau.

3. Bapak Torkis Nasution, M.Kom, pembantu Ketua I STMIK-AMIK Riau.

4. Bapak Unang Rio, M.Kom, pembantu Ketua II STMIK-AMIK Riau.

5. Bapak Dwi Haryono, M.Kom, pembantu Ketua III STMIK-

AMIK Riau.

6. Bapak Edwar Ali, M.Kom, Ketua Jurusan Teknik Informatika STMIK-AMIK

Riau.

7. Ibu Susanti, M.IT, selaku pembimbing yang telah banyak

memberikan bimbingan kepada penulis selama proses penyusunan skripsi ini.

8. Ibu Triyani Arita Fitri, M.Kom, selaku dosen pembimbing akademik yang

terus mendorong semangat penulis untuk menyelesaikan skripsi.

ii
9. Seluruh Dosen STMIK-AMIK Riau yang membina dan

mendidik penulis selama masa perkuliahan.

Walaupun skripsi ini telah selesai disusun, penulis yakin bahwa skripsi ini

masih memiliki banyak kekurangan. Oleh karena itu, penulis berharap pembaca

dapat memberikan kritik dan saran yang membangun demi kesempurnaan skripsi

ini. Demikianlah harapan penulis, semoga apa yang dicita-citakan berhasil dengan

baik.

Pekanbaru, 07 Maret 2015

Benhard Hutauruk

iii
DAFTAR ISI

Halaman

COVER JUDUL SKRIPSI


LEMBAR PERSETUJUAN SKRIPSI
LEMBAR PENGESAHAN SKRIPSI

ABSTRAK ......................................................................................................i
KATA PENGANTAR .....................................................................................ii
DAFTAR ISI ...................................................................................................iv
DAFTAR GAMBAR ......................................................................................vi
DAFTAR TABEL ...........................................................................................viii
DAFTAR LAMPIRAN ..................................................................................ix

BAB I PENDAHULUAN ..............................................................................1


1.1. Latar Belakang Masalah ...............................................................1
1.2. Identifikasi Masalah.......................................................................3
1.3. Batasan Masalah ...........................................................................3
1.4. Rumusan Masalah..........................................................................4
1.5. Tujuan dan Manfaat Penelitian......................................................4
1.6. Metodologi Penelitian....................................................................4
1.7. Sistematika Penelitian....................................................................6

BAB II LANDASAN TEORI ........................................................................8


2.1. Model Suasana Hati ......................................................................9
2.2. Sistem Temu Kembali Informasi...................................................10
2.3. Penambangan Teks.........................................................................11
2.4. Tahapan Klasifikasi Teks ..............................................................13
2.4.1. Tahap Pemrosesan Awal Teks..............................................13
2.4.2. Tahap Pelatihan....................................................................13
2.4.3. Tahap Klasifikasi dan Temu Kembali Dokumen.................14
2.4.3.1. TF-IDF.....................................................................14
2.4.3.2. Pengukuran Kemiripan............................................18
2.4.3.3. Klasifikasi................................................................20
2.5. Evaluasi .........................................................................................23

BAB III ANALISIS DAN PEMBAHASAN..................................................25


3.1. Analisis Masalah Umum ...............................................................25

iv
3.2. Data Penelitian ..............................................................................26
3.3. Prosedur Klasifikasi Dokumen Teks .............................................26
3.4. Contoh Klasifikasi Dokumen Dengan KNN Termodifikasi
Secara Manual................................................................................28
3.5. Perancangan Global.......................................................................35
3.5.1. Analisis Diagram Use Case.................................................35
3.5.2. Class Diagram.....................................................................62
3.5.2. Entity Relationship Diagram (ERD) ...................................64
3.6. Perancangan Output.......................................................................65
3.7. Perancangan Input..........................................................................74
3.8. Perancangan Sistem Basis Data.....................................................77

BAB IV IMPLEMENTASI SISTEM............................................................82


4.1. Pengujian Sistem............................................................................82
4.2. Hasil Implementasi........................................................................83
4.3. Klasifiasi Data Uji..........................................................................90
4.3. Evaluasi..........................................................................................95

BAB V P E N U T U P.....................................................................................101
5.1. Kesimpulan....................................................................................101
5.2. Saran..............................................................................................102

DAFTAR PUSKATA......................................................................................103
LAMPIRAN....................................................................................................104

v
DAFTAR GAMBAR

Halaman

Gambar 2.1 Contoh Persiapan Dokumen ........................................................16


Gambar 2.2 Contoh Perhitungan Cosine Similarity ........................................18
Gambar 2.3 Contoh Pencarian Nilai n .............................................................21
Gambar 2.4 Contoh Perhitungan Probabilitas .................................................24
Gambar 3.1 Prosedur Klasifikasi Dokumen ....................................................27
Gambar 3.2 Perhitungan Cosine Similarity .....................................................30
Gambar 3.3 Perhitungan Pencarian Nilai k Baru (n) dengan k tetapan 4 ........32
Gambar 3.4 Perhitungan Pencarian Nilai k Baru (n) dengan k tetapan 5 ........33
Gambar 3.5 Perhitungan Pencarian Probabilitas k tetapan 4............................34
Gambar 3.6 Perhitungan Pencarian Probabilitas k tetapan 5............................34
Gambar 3.7 Diagram Use Case Sistem Klasifikasi Lirik Lagu .......................36
Gambar 3.8 Diagram Aktifitas Untuk Use Case Tambah Data Latih ..............38
Gambar 3.9 Diagram Urutan Untuk Use Case Tambah Data Latih ................39
Gambar 3.10 Diagram Aktifitas Untuk Use Case Tambah Data Uji ...............41
Gambar 3.11 Diagram Urutan Untuk Use Case Tambah Data Uji ..................42
Gambar 3.12 Diagram Aktifitas Detil Data Latih.............................................44
Gambar 3.13 Diagram Urutan Detil Data Latih...............................................45
Gambar 3.14 Diagram Aktifitas Detil Data Uji................................................47
Gambar 3.15 Diagram Urutan Detil Data Uji...................................................48
Gambar 3.16 Diagram Aktifitas Untuk Use Case Menghapus Data Latih ......50
Gambar 3.17 Diagram Urutan Untuk Use Case Menghapus Data Latih ........51
Gambar 3.18 Diagram Aktifitas Untuk Use Case Mengapus Data Uji ...........53
Gambar 3.19 Diagram Urutan Untuk Use Case Menghapus Data Uji ...........54
Gambar 3.20 Diagram Aktifitas Untuk Use Case Melakukan
Klasifikasi Dokumen …………………………………………...56
Gambar 3.21 Diagram Urutan Use Case Melakukan Klasifikasi Dokumen ...58
Gambar 3.22 Diagram Aktifitas Untuk Use Case Melakukan Temu Kembali
Dokumen ....................................................................................60
Gambar 3.23 Diagram Urutan Untuk Use Case Melakukan Temu
Kembali Dokumen .....................................................................61
Gambar 3.24 Rancangan Class Diagram ........................................................62
Gambar 3.25 Disain ERD.................................................................................64
Gambar 3.26 Rancangan Halaman Daftar Data Latih .....................................65

vi
Gambar 3.27 Rancangan Halaman Daftar Data Uji ........................................66
Gambar 3.28 Rancangan Halaman Hasil Proses Klasifikasi ...........................67
Gambar 3.29 Rancangan Halaman Detil Tahapan Proses Klasifikasi Persiapan
Dokumen Latih dan Uji, Tokenisasi dan Pembobotan, Proses
Pencarian Kemiripan...................................................................68
Gambar 3.30 Rancangan Halaman Detil Tahapan Proses Klasifikasi Hasil Cosine
Similarity, Hasil Pencarian k Baru (n), Hasil Pencarian Probabilitas
dengan k Baru (n)........................................................................69
Gambar 3.31 Rancangan Halaman Hasil Klasifikasi ......................................70
Gambar 3.32 Rancangan Halaman Hasil Klasifikasi Perkelas ........................71
Gambar 3.33 Rancangan Halaman Detil Data Latih .......................................72
Gambar 3.34 Rancangan Halaman Detil Data Uji ...........................................73
Gambar 3.35 Rancangan Halaman Tambah Data Latih ...................................74
Gambar 3.36 Rancangan Halaman Tambah Data Uji ......................................75
Gambar 3.37 Rancangan Halaman Proses Klasifikasi ....................................76
Gambar 4.1 Tampilan Menu Utama..................................................................83
Gambar 4.2 Tampilan Menu Data Latih...........................................................84
Gambar 4.3 Tampilan Form Tambah Data Latih..............................................85
Gambar 4.4 Tampilan Menu Data Uji...............................................................86
Gambar 4.5 Tampilan Form Tambah Data Uji.................................................87
Gambar 4.6 Tampilan Form Proses Klasifikasi................................................88
Gambar 4.7 Tampilan Hasil Proses Klasifikasi................................................88
Gambar 4.8 Tampilan Menu Hasil Klasifikasi.................................................89
Gambar 4.9 Tampilan Menu Hasil Klasifikasi Perkategori..............................89
Gambar 4.10 Contoh Pencarian Evaluasi kelas Sedih......................................97
Gambar 4.11 Contoh Pencarian Evaluasi kelas Marah.....................................98
Gambar 4.12 Contoh Pencarian Evaluasi kelas Semangat...............................98
Gambar 4.13 Contoh Pencarian Evaluasi kelas Cinta......................................99

vii
DAFTAR TABEL

Halaman

Tabel 2.1 Contoh Pengindeksan dan Term Weighting ......................................17


Tabel 2.2 Hasil Kemiripan Dokumen ..............................................................19
Tabel 2.3 Peringkat Hasil Kemiripan Dokumen...............................................19
Tabel 2.4 Hasil Pencarian Nilai k Baru.............................................................21
Tabel 2.5 Hasil Pencarian Probabilitas.............................................................22
Tabel 3.1 Contoh Dokumen Latih dan Uji .......................................................29
Tabel 3.2 Hasil Cosine Similarity ....................................................................31
Tabel 3.3 Pengurutan Hasil Cosine Similarity..................................................31
Tabel 3.4 Tabel Hasil Pencarian k baru (n).......................................................33
Tabel 3.5 Tabel Hasil Pencarian Probabilitas dengan k baru (n)......................35
Tabel 3.6 Skenario Use Case Tambah Data Latih............................................37
Tabel 3.7 Skenario Use Case Tambah Data Uji................................................ 40
Tabel 3.8 Skenario Use Case Detil Data Latih.................................................43
Tabel 3.9 Skenario Use Case Menghapus Data Latih......................................46
Tabel 3.10 Skenario Use Case Menghapus Data Latih....................................49
Tabel 3.11 Skenario Use Case Menghapus Data Uji........................................ 52
Tabel 3.12 Skenario Use Case Melakukan Klasifikasi Dokumen.................... 55
Tabel 3.13 Skenario Use Case Melakukan Temu Kembali Dokumen.............. 59
Tabel 3.14 Keterangan Class Diagram............................................................. 63
Tabel 3.15 Perancangan File DataLatih............................................................ 77
Tabel 3.16 Perancangan File DataLatihDetil.................................................... 78
Tabel 3.17 Perancangan File DataUji............................................................... 79
Tabel 3.18 Perancangan File DataUjiDetil....................................................... 79
Tabel 3.19 Perancangan File Klasifikasi .......................................................... 80
Tabel 4.1 Hasil Klasifikasi k tetapan 10 .......................................................... 91
Tabel 4.2 Hasil Klasifikasi k tetapan 20 .......................................................... 92
Tabel 4.3 Hasil Klasifikasi k tetapan 70 .......................................................... 93
Tabel 4.4 Hasil Klasifikasi k tetapan 80 .......................................................... 94
Tabel 4.5 Confusion Matrix k tetapan 10 ......................................................... 96
Tabel 4.6 Confusion Matrix k tetapan 70 ......................................................... 96
Tabel 4.7 Confusion Matrix k tetapan 70 ......................................................... 96
Tabel 4.8 Confusion Matrix k tetapan 10 ......................................................... 97
Tabel 4.9 Precision, Recall, Accuracy dan Fmeasure Hasil Klasifikasi ............... 99
Tabel 4.10 Rata-rata Precision, Recall, Accuracy dan Fmeasure
Hasil Klasifikasi ............................................................................ 100

viii
DAFTAR LAMPIRAN

Halaman

Lampiran 1. Contoh Dokumen Latih dan Dokumen Uji ................................. 104


Lampiran 2. Contoh Hasil Pengindeksan dan Term Weighting ....................... 107
Lampiran 3. Contoh Proses Pencarian Kemiripan ........................................... 113
Lampiran 4. Dokumen Latih............................................................................. 119
Lampiran 5. Dokumen Uji ............................................................................... 122

ix

You might also like