Pengertian Data Mining
Data mining adalah
upaya untuk mendapatkan informasi yang berharga dan berguna pada database yang
sangat besar. Data Mining disebut juga
sebagai Knowledge Discovery in Database
(KDD). Proses Knowlegde Discovery in
Database ini melibatkan hasil proses
data mining (proses pengekstrak kecenderungan suatu pola data), kemudian
mengubah hasilnya secara akurat menjadi informasi yang mudah dipahami.
Berdasarkan definisi
diatas, hal penting yang terkait dengan Data Mining adalah:
1.
Data mining merupakan suatu proses otomatis
terhadap data yang sudah ada.
2.
Data yang akan diproses berupa data yang sangat
besar.
3.
Tujuan data mining adalah mendapatkan hubungan
atau pola yang akan mungkin memberikan
indikasi yang bermanfaat.
Fungsi dan Tugas Data Mining
Data mining
menganalisis data menggunakan alat untuk menemukan pola dan aturan dalam
himpunan data. Perangkat lunak bertugas
untuk menmukan pola dengan mengidentifikasi aturan dan fitur pada data. Alat pada data mining diharapkan mampu
mengenal pola ini dalam data dengan input minimal dari user.
Langkah-langkah Data Mining
Menurut Feen Lee
& Juan Santana, ada empat tahap yang dilalui dalam Data Mining antara lain:
1.
Tahap pertama yaitu mendefinisikan permasalahan
yang ingin diketahui. Misalnya ingin mengetahui apakah seorang customer berpotensi
memiliki kredit macet atau mengidentifikasi seorang customer apakah akan pindah
ke kompetitor bisnis kita. Setelah menemukan pertanyaan bisnis yang perlu
dijawab oleh data mining, selanjutnya tentukan tipe tugas untuk menjawab
pertanyaan bisnis tersebut. Tugas dasar yang menjadi dasar algoritma data
mining adalah klasifikasi, regresi, segmentasi, asosiasi dan sequence analisis.
2.
Tahap kedua yaitu mencari data yang mendukung
definisi masalah. Menentukan porsi data yang digunakan men-training data mining berdasarkan algoritma data mining yang telah
dibuat. Setelah persiapan data selesai dilakukan, langkah berikutnya adalah
memberikan sebagian data kedalam algoritma data mining.
3.
Tahap ketiga yaitu memvalidasi apakah data
mining memberikan prediksi yang akurat. Setelah training data selesai dilakukan, data mining tersebut perlu diuji
atau di validasi keakuratannya terhadap data testing.
4.
Tahap keempat yaitu memilih aplikasi yang tepat
terhadap data mining untuk membuat prediksi.
Algoritma Apriori
Algoritma apriori adalah suatu algoritma dasar
yang diusulkan oleh Agrawal & Srikant pada tahun 1994 untuk menentukan Frequent
itemsets untuk aturan asosiasi Boolean. Algoritma Apriori termasuk jenis Aturan
Asosiasi pada data mining. Aturan yang menyatakan asosiasi antara beberapa
atribut sering disebut affinity analysis
atau market basket analisis. Analisis asosiasi atau association rule mining adalah teknik data mining untuk menemukan
aturan suatu kombinasi item. Salah satu tahap analisis asosiasi yang menarik
perhatian banyak peneliti untuk menghasilkan algoritma yang efisien adalah
analisis pola frequensi tinggi (frequent pattern mining). Penting tidaknya suatu
asosiasi dapat diketahui dengan dua tolok ukur, yaitu : support dan confidence. Support
(nilai penunjang) adalah persentase kombinasi item tersebut dalam database,
sedangkan confidence (nilai
kepastian) adalah kuatnya hubungan antara-item dalam aturan asosiasi. (Kusrini,
Emha Taufiq Luthfi,2009 : 149).
Algoritma apriori
dibagi menjadi beberapa tahap yang disebut narasi atau pass (Devi dinda
setiawan, 2009) yaitu:
1.
Pembentukan kandidat itemset. Kandidat k-itemset dibentuk dari kombinasi (k-1)itemset yang didapat dari iterasi
sebelumnya. Satu cara dari algoritma apriori adalah pemangkasan kandidat
k-itemset yang subsetnya berisi k-1 item
tidak termasuk dalam pola frekuensi tinggi dengan panjang k-1.
2.
Penghitungan support dari tiap kandidat
k-itemset. Support dari tiap kandidat k-itemset didapat dengan menscan database
untuk menghitung jumlah transaksi yang memuat semua item didalam kandidat
k-itemset tersebut. Ini adalah juga ciri
dari algoritma apriori dimana diperlukan penghitungan dengan cara seluruh database
sebanyak k-itemset terpanjang.
3.
Tetapkan pola frekuensi tinggi. Pola frekuensi
tinggi yang memuat k item atau kitemset ditetapkan dari kandidat k-itemset yang
supportnya lebih besar dari minimum support.
4.
Bila tidak didapat pola frekuensi tinggi baru
maka seluruh proses dihentikan. Untuk lebih memahami proses algoritma Apriori
maka berikut ini akan diberikan illustrasi penggunaan algoritma Apriori. Dengan
menggunakan database pada gambar 4 dan mengasumsikan minimum support adalah 2 transaksi.
Apotek dan Alat-Alat Kesehatan
Pengertian Apotek menurut
(Kepmenkes RI).No.1332/M ENKES/SK/X/2002 adalah suatu tempat tertentu, tempat
di lakukan pekerjaan kefarmasian penyaluran perbekalan farmasi kepada
masyarakat. Yang di maksud pekerjaan kefarmasiaan di antaranya pengadaan obat,
penyimpanan obat, pembuatan sediaan obat, peracikan , penyaluran dan penyerahan
perbekalan farmasi serta memberikan informasi kepada masyarakat mengenai
perbekalan kefarmasian yang terdiri dari obat, bahan obat, obat tradisional,
alat-alat kesehatan, dan kosmetik. (http://farmasismk.blogspot.com/2011/11/pengertianapotek html)
Analisa
Sistem informasi
aktifitas penjualan dan pembelian alat-alat kesehatan di Apotek Kelambir 2
Medan sudah menggunakan komputer dengan berbasis
jaringan yang terpusat kedalam satu server.
Sistem informasi persediaan barang di Apotek ini terdiri dari pelayanan
resep obat, penjualan obat dan alat-alat kesehatan serta gudang farmasi,. Ditampilan gudang farmasi terdiri atas bagian
persediaan, laporan pembelian, laporan penjualan. Data penjualan alat-alat kesehatan
terdiri atas attribute nomor, tanggal, nomor slip, nama, jumlah barang, harga
dan total harga. Untuk mendapat analisa data maka data penjualan
di export kedalam database Microsoft
excel karena bersifat spreadsheet
sehingga sangat mendukung beberapa aplikasi data mining, dimana aplikasi data
mining digunakan sebagai tempat uji coba atau implementasi. Data mining yang
digunakan yaitu untuk mendapatkan informasi yang berharga dan berguna khususnya
dalam penjualan alat-alat kesehatan.
Pembahasan
Analisis data
dilakukan pada penjualan data alat kesehatan pada Apotek Kelambir 2 Medan ini
bertujuan untuk menemukan pola penjualan alat-alat kesehatan, serta hubungan
antar item jenis alat-alat kesehatan didalam transaksi. Tahap dalam menganalisa
data dengan algoritma Apriori pada penjualan data alat-alat kesehatan dimulai
dengan menyeleksi dengan cara membersihkan data data yang akan dianalisis,
kemudian mencari semua jenis item nama alat-alat kesehatan yang ada didalam
list transaksi penjualan, selanjut mencari jumlah setiap item yang ada pada
setiap transaksi penjualan dari alat-alat kesehatan tersebut. Sesuai dengan support yang telah ditentukan maka
terseleksilah beberapa item data yang memenuhi minimal support sesuai dengan jumlah item barang didalam transaksi, itu
disebut pembentukan kombinasi satu item. Tahap selanjutnya dari item-item
alat-alat kesehatan yang telah terseleksi dibentuk lah kombinasi dua item, maka
terbentuk lah beberapa item data dengan kombinasi 2 item yang berbeda, dengan
support yang ditentukan maka terseleksi lah beberapa data dua item, ini disebut
pembentukan kombinasi dua item. Demikian seterusnya sampai kombinasi batas maksimal
item transaksi.
Pengujian
Untuk membuktikan
data-data yang telah dihasilkan berupa pola hubungan kombinasi antar items dan
rules-rules asosiasi sesuai dengan Algoritma Apriori maka perlu dilakukan
pengujian dengan menggunakan suatu aplikasi. Aplikasi yang digunakan adalah
Tanagra versi 1.4. Secara umum, cara menggunakan aplikasi Tanagra dimulai
dengan mengklik menu File, New, muncul jendela untuk load database. Load
database supaya masuk kesistem, klik menu icon define status dan atur
parameternya, masukkan komponen frequent itemsets dan Apriori dan masukkan
parameternya, kemudian execute, setelah view untuk melihat hasilnya.
Pengujian yang dilakukan pertama
adalah pengujian untuk menghasilkan jenis item dan pola kombinasi dua items.
Dengan paremeters adalah minimal support sama dengan 16 persen (%), maxsimal
support sama dengan 100 persen (%), minimal length sama dengan satu, maksimal
length sama dengan dua, dan itemset type sama dengan frequent. Setelah dilakukan penentuan nilai parameter,
maka dihasilkan jenis item dan pola kombinasi dua items. Setelah melakukan
pengujian untuk menghasilkan jenis items dan pola kombinasi, mulai dari
kombinasi dua items sampai dengan pola kombinasi lima items, maka pengujian
yang dilakukan selanjutnya adalah pengujian untuk menghasilkan rules-rules,
dimana rules-rules tersebut terbentuk dari pola kombinasi items pada pengujian
sebelumnya. Pengujian yang dilakukan pertama adalah pengujian untuk
menghasilkan rules-rules yang terbentuk dari pola kombinasi dua items. Paremeters yang harus diisi adalah support
sama dengan 16 persen (%), Confidence sama dengan 70 persen (%), maksimal card
itemsets sama dengan dua. Jendela Association rules. Pada pengujian untuk menghasilkan rules dari pola
kombinasi dua items. Rules diatas
terdiri atas Antecedent, consequent, lift, support(%), Confidence (%).
Antecedent adalah bentuk kondisi dari pada
rules, consequent adalah bentuk pernyataan dari pada rules, lift adalah
menunjukkan adanya tingkat kekuatan rules kejadian acak dari antecedent dan
consequent berdasarkan pada support masing-masing, support adalah persentasi
kombinasi items tersebut, sedangkan confidence adalah kuatnya hubungan antar
items dalam aturan asosiasi.
Kesimpulan
Berdasarkan
pembahasan yang telah dilakukan dengan
algoritma Apriori dan dilakukannya
pengujian dengan aplikasi Tanagra maka penulis menarik beberapa
kesimpulan yang penting. Adapun kesimpulan-kesimpulan tersebut adalah sebagai
berikut: 1. Data Mining dapat di implementasikan dengan menggunakan Database
penjualan alat-alat kesehatan karena dapat menemukan kecenderungan pola
kombinasi itemsets sehingga dapat
dijadikan sebagai informasi yang sangat berharga dalam pengambilan keputusan
untuk mempersiapkan stok jenis barang apa yang diperlukan kemudian. 2.
Penerapan Algoritma Apriori pada teknik
Data Mining sangat efisien dan dapat mempercepat proses pembentukan
kecenderungan pola kombinasi itemset
hasil penjualan alat-alat kesehatan di Apotek Kelambir-2 Medan, yaitu
dengan support dan confidence tertinggi adalah Stick Asam Urat - Stick Gula dan Stick Colestrol- Stick Gula.
Saran
Untuk kepentingan
lebih lanjut dari penulisan tesis ini maka penulis memberikan beberapa saran
sebagai berikut : 1. Data mining dengan Algoritma Apriori memiliki kelemahan
karena harus melakukan scan database setiap kali iterasi, sehingga untuk
database yang sangat besar membutuhkan waktu yang lama. 2. Penerapan algoritma
Apriori sangat praktis namun perlu dilakukan perbandingan dengan algoritma
lain, untuk menguji sejauh mana Algoritma
Apriori masih dapat diandalkan untuk memproses dan menemukan pola
hubungan (asosiasi) antar item pada database
berskala besar. 3. Dalam penggunaan algoritma Apriori di perlukan
pemahaman tentang aturan Asosiasi dan
Data Mining dan cara menjalankan aplikasi sofware Tanagra 1.4.48.
Daftar Pustaka
Pratima Gautam, and K. R.
Pardasani. Efficient Method for Multiple-Level Association Rules in Large
Databases. Journal of Emerging Trends in Computing and Information Sciences.
VOL.2 No.12. December 2011.
Abdullah Saad Almalaise Alghamdi.,
Efficient Implementation of FP Growth
Algoritma- Data Mining on Medical Data. International Journal of Computer
Science and Network Security, VOL.11 No.12, December 2011.
Sanjeev Rao, and Priyanka Gupta.
Implementing Improved Algorithm Over Apriori Data Mining Association Rule
Algorithm. International Journal of Computer Science and Technology
(IJCST)-VOL.3 Issue 1, Jan-March 2012.
OTHMAN YAHYA, OSMAN HEGAZY, and
EHAB EZAT. An Efficient Implemantation of Apriori Algorithm Based on
HADOOPMAPREDUCE Model. International Journal of Reviews in Computing
(IJRIC)-VOL.12, December 2012.
Jogi. Suresh, and T. Ramanjaneyulu.
Mining Frequent Itemsets Using Apriori Algorithm. International Journal of
Computer Trends and Technology (IJCTT)-VOL.4 Issue4-April 2013.
Shuruti Aggarwal, and Ranveer Kaur.
Comparative Study of Various Improved
Versions of Apriori Algorithm. International Journal of Engineering Trends and
Technology (IJETT)-VOL.4 Issue4-April 2013.
Prof. Paresh Tama., and Dr. Yogesh
Ghodasara. Foundation for Frequent Pattern Mining Algorithms’ Implementation.
International Journal of Computer Trends and Technology (IJCTI)-VOL.4 Issue 7 -
July 2013.