Professional Documents
Culture Documents
PEMBIMBING
“Data Mining”
Oleh :
HIMAWAN WIBISONO
10853002752
2010/2011
DATA MINING
Data mining merupakan cabang ilmu yang relatif baru dalam ilmu
komputer, walaupun sejak tahun 1990-an teknik ini telah dikemukakan.
Dan sampai sekarang masih terus diperdebatkan data mining
ditempatkan di bidang ilmu mana? Karena data mining menyangkut
database, kecerdasan buatan, sistem pakar, statistik, dsb. Ada juga yang
mengatakan bahwa data mining tidak lebih dari machine learning atau
analisa statistik untuk mengeksplorasi pengetahuan dalam sebuah
database. Dalam jurnal ilmiah data mining dikenal juga dengan
Knowledge Discovery in Databases (KDD).
Ada banyak jenis teknik analisa yang dapat digolongkan dalam data
mining. Diantaranya:
2. Classification
Aplikasi lain yang penting dari data mining adalah kemampuannya
untuk melakukan proses klasifikasi pada suatu data dalam jumlah besar.
Hal ini sering disebut mining classification rules. Classification adalah
proses untuk menemukan model atau fungsi yang menjelaskan atau
membedakan konsep atau kelas data, dengan tujuan untuk dapat
memperkirakan kelas dari suatu objek yang labelnya tidak diketahui.
Model itu sendiri bisa berupa aturan “jika-maka”, berupa decision tree,
formula matematis atau neural network. Sebagai contoh, sebuah dealer
mobil inginbmengkiasifikasikan pelanggannya menurut kecenderungan
mereka untuk menyukai mobil jenis tertentu, sehingga para sales yang
bekerja disitu akan mengetahui siapa yang harus didekati, kemana
katalog mobil jenis baru harus dikirim, sehingga hal ini akan sangat
membantu dalam hal promosi.
Decision tree adalah salah satu metode classification yang paling
populer karena mudah untuk diinterpretasi oleh manusia. Proses
classification biasanya dibagi menjadi dua fase : learning dan test. Pada
fase learning, sebagian data yang telah diketahui kelas datanya
diumpankan untuk membentuk model perkiraan. Kemudian pada fase test
model yang sudah terbentuk diuji dengan sebagian data lainnya untuk
mengetahui akurasi dari model tsb. Bila akurasinya mencukupi model ini
dapat dipakai untuk prediksi kelas data yang belum diketahui.
3. Clustering
4. Sekuensial
Fungsi pola sekuensial menganalisa sekumpulan rekord pada suatu
periode waktu, misalnya untuk menganalisa trend. Anggaplah kita
memiliki suatu basis data yang ukurannya besar, yaitu basis data
transaksi dimana setiap transaksi terdiri dari nomor pelanggan, waktu
transaksi dan item-item yang ditransaksikan. Suatu pola dapat
ditampilkan dalam contoh sebagai berikut, pelanggan biasanya membeli
gula Iangsung melakukan transaksi membeli kopi. Dari semua transaksi
membeli gula ternyata hampir seluruhnya terdapat transaksi membeli
kopi. Maka dari pola-pola yang ada ini dapat dijadikan masukan bahwa
telah terjadi suatu kecendrungan (trend) dari pelanggan dimana setiap
pelanggan melakukan transaksi membeli gula maka akan diikuti oleh
transaksi membeli kopi. Untuk itu pihak manajemen dapat menempatkan
letak item kopi dekat dengan item gula. Sehingga memudahkan
pelanggan untuk melakukan transaksi selanjutnya.
5. Visualisasi Data
Visualisasi data memungkinkan si analis memperoleh pemahaman
yang dalam dan lebih intuitif mengenai data dan dapat bekerja sebaik
mungkin pada data mining,