You are on page 1of 6

MATAKULIAH DOSEN

PEMBIMBING

Data Mining Indi


Rahman, M.Kom

“Data Mining”

Oleh :
HIMAWAN WIBISONO
10853002752

Mata Kuliah : Data Mining


Semester : V/B

JURUSAN SISTEM INFORMASI


FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS ISLAM NEGERI SULTAN SYARIF KASIM RIAU

2010/2011
DATA MINING

Data mining merupakan cabang ilmu yang relatif baru dalam ilmu
komputer, walaupun sejak tahun 1990-an teknik ini telah dikemukakan.
Dan sampai sekarang masih terus diperdebatkan data mining
ditempatkan di bidang ilmu mana? Karena data mining menyangkut
database, kecerdasan buatan, sistem pakar, statistik, dsb. Ada juga yang
mengatakan bahwa data mining tidak lebih dari machine learning atau
analisa statistik untuk mengeksplorasi pengetahuan dalam sebuah
database. Dalam jurnal ilmiah data mining dikenal juga dengan
Knowledge Discovery in Databases (KDD).

Istilah data mining sudah berkembang jauh dalam mengadaptasi


setiap bentuk analisa data. Pada dasarnya data mining berhubungan
dengan analisa data dan penggunaan teknik-teknik perangkat lunak untuk
mencari pola dan keteraturan dalam himpunan data yang sifatnya
tersembunyi.

Data mining diartikan sebagai suatu proses ekstraksi informasi


berguna dan potensial dari sekumpulan data yang terdapat secara implisit
dalam suatu basis data. Banyak istilah lain dari data mining yang dikenal
luas seperti knowledge mining from databases, knowledge extraction,
data archeology, data dredging, data analysis dan lain sebagainya.

Ada banyak jenis teknik analisa yang dapat digolongkan dalam data
mining. Diantaranya:

1. Association Rule Mining


Association rule mining adalah teknik mining untuk menemukan
aturan assosiatif antara suatu kombinasi item. Sebagai contoh, dari suatu
himpunan data transaksi, seseorang mungkin menemukan suatu
hubungan berikut, yaitu jika seorang pelanggan membeli selai, ia
biasanya juga membeli roti dalam satu transaksi yang sama. Oleh karena
proses untuk menemukan hubungan antar item ini mungkin memerlukan
pembacaan data transaksi secara berulang-ulang dalam sejumlah besar
data-data transaksi untuk menemukan pola-pola hubungan yang berbeda-
beda, maka waktu dan biaya komputasi tentunya juga akan sangat besar,
sehingga untuk menemukan hubungan tersebut diperlukan suatu
algoritma yang efisien dan metode-metode tertentu.

2. Classification
Aplikasi lain yang penting dari data mining adalah kemampuannya
untuk melakukan proses klasifikasi pada suatu data dalam jumlah besar.
Hal ini sering disebut mining classification rules. Classification adalah
proses untuk menemukan model atau fungsi yang menjelaskan atau
membedakan konsep atau kelas data, dengan tujuan untuk dapat
memperkirakan kelas dari suatu objek yang labelnya tidak diketahui.
Model itu sendiri bisa berupa aturan “jika-maka”, berupa decision tree,
formula matematis atau neural network. Sebagai contoh, sebuah dealer
mobil inginbmengkiasifikasikan pelanggannya menurut kecenderungan
mereka untuk menyukai mobil jenis tertentu, sehingga para sales yang
bekerja disitu akan mengetahui siapa yang harus didekati, kemana
katalog mobil jenis baru harus dikirim, sehingga hal ini akan sangat
membantu dalam hal promosi.
Decision tree adalah salah satu metode classification yang paling
populer karena mudah untuk diinterpretasi oleh manusia. Proses
classification biasanya dibagi menjadi dua fase : learning dan test. Pada
fase learning, sebagian data yang telah diketahui kelas datanya
diumpankan untuk membentuk model perkiraan. Kemudian pada fase test
model yang sudah terbentuk diuji dengan sebagian data lainnya untuk
mengetahui akurasi dari model tsb. Bila akurasinya mencukupi model ini
dapat dipakai untuk prediksi kelas data yang belum diketahui.

3. Clustering

Berbeda dengan association rule mining dan classification dimana


kelas data telah ditentukan sebelumnya, clustering melakukan penge-
lompokan data tanpa berdasarkan kelas data tertentu. Bahkan clustering
dapat dipakai untuk memberikan label pada kelas data yang belum
diketahui itu. Karena itu clustering sering digolongkan sebagai metode
unsupervised learning. Prinsip dari clustering adalah memaksimalkan
kesamaan antar anggota satu kelas dan meminimumkan kesamaan antar
kelas/cluster. Clustering dapat dilakukan pada data yan memiliki
beberapa atribut yang dipetakan sebagai ruang multidimensi. Melakukan
analisa dengan clustering, akan sangat membantu untuk membentuk
partisi-parti si yang berguna terhadap sejumlah besar

4. Sekuensial
Fungsi pola sekuensial menganalisa sekumpulan rekord pada suatu
periode waktu, misalnya untuk menganalisa trend. Anggaplah kita
memiliki suatu basis data yang ukurannya besar, yaitu basis data
transaksi dimana setiap transaksi terdiri dari nomor pelanggan, waktu
transaksi dan item-item yang ditransaksikan. Suatu pola dapat
ditampilkan dalam contoh sebagai berikut, pelanggan biasanya membeli
gula Iangsung melakukan transaksi membeli kopi. Dari semua transaksi
membeli gula ternyata hampir seluruhnya terdapat transaksi membeli
kopi. Maka dari pola-pola yang ada ini dapat dijadikan masukan bahwa
telah terjadi suatu kecendrungan (trend) dari pelanggan dimana setiap
pelanggan melakukan transaksi membeli gula maka akan diikuti oleh
transaksi membeli kopi. Untuk itu pihak manajemen dapat menempatkan
letak item kopi dekat dengan item gula. Sehingga memudahkan
pelanggan untuk melakukan transaksi selanjutnya.
5. Visualisasi Data
Visualisasi data memungkinkan si analis memperoleh pemahaman
yang dalam dan lebih intuitif mengenai data dan dapat bekerja sebaik
mungkin pada data mining,

You might also like