Sabtu, 16 Maret 2019

IMPLEMENTASI DATA MINING ALGORITMA APRIORI PADA SISTEM PERSEDIAAN ALAT-ALAT KESEHATAN


Pengertian Data Mining
Data mining adalah upaya untuk mendapatkan informasi yang berharga dan berguna pada database yang sangat besar.  Data Mining disebut juga sebagai Knowledge Discovery in Database (KDD). Proses Knowlegde Discovery in Database  ini melibatkan hasil proses data mining (proses pengekstrak kecenderungan suatu pola data), kemudian mengubah hasilnya secara akurat menjadi informasi yang mudah dipahami.
Berdasarkan definisi diatas, hal penting yang terkait dengan Data Mining adalah:
1.       Data mining merupakan suatu proses otomatis terhadap data yang sudah ada.
2.       Data yang akan diproses berupa data yang sangat besar.
3.       Tujuan data mining adalah mendapatkan hubungan atau pola yang akan  mungkin memberikan indikasi yang bermanfaat.

Fungsi dan Tugas Data Mining
Data mining menganalisis data menggunakan alat untuk menemukan pola dan aturan dalam himpunan data.  Perangkat lunak bertugas untuk menmukan pola dengan mengidentifikasi aturan dan fitur pada data.  Alat pada data mining diharapkan mampu mengenal pola ini dalam data dengan input minimal dari user.

Langkah-langkah Data Mining
Menurut Feen Lee & Juan Santana, ada empat tahap yang dilalui dalam Data Mining antara lain:
1.       Tahap pertama yaitu mendefinisikan permasalahan yang ingin diketahui. Misalnya ingin mengetahui apakah seorang customer berpotensi memiliki kredit macet atau mengidentifikasi seorang customer apakah akan pindah ke kompetitor bisnis kita. Setelah menemukan pertanyaan bisnis yang perlu dijawab oleh data mining, selanjutnya tentukan tipe tugas untuk menjawab pertanyaan bisnis tersebut. Tugas dasar yang menjadi dasar algoritma data mining adalah klasifikasi, regresi, segmentasi, asosiasi dan sequence analisis.

2.       Tahap kedua yaitu mencari data yang mendukung definisi masalah. Menentukan porsi data yang digunakan men-training data mining berdasarkan algoritma data mining yang telah dibuat. Setelah persiapan data selesai dilakukan, langkah berikutnya adalah memberikan sebagian data kedalam algoritma data mining.

3.       Tahap ketiga yaitu memvalidasi apakah data mining memberikan prediksi yang akurat. Setelah training data selesai dilakukan, data mining tersebut perlu diuji atau di validasi keakuratannya terhadap data testing.

4.       Tahap keempat yaitu memilih aplikasi yang tepat terhadap data mining untuk membuat prediksi.

Algoritma Apriori
 Algoritma apriori adalah suatu algoritma dasar yang diusulkan oleh Agrawal & Srikant pada tahun 1994 untuk menentukan Frequent itemsets untuk aturan asosiasi Boolean. Algoritma Apriori termasuk jenis Aturan Asosiasi pada data mining. Aturan yang menyatakan asosiasi antara beberapa atribut sering disebut affinity analysis atau market basket analisis. Analisis asosiasi atau association rule mining adalah teknik data mining untuk menemukan aturan suatu kombinasi item. Salah satu tahap analisis asosiasi yang menarik perhatian banyak peneliti untuk menghasilkan algoritma yang efisien adalah analisis pola frequensi tinggi (frequent pattern mining). Penting tidaknya suatu asosiasi dapat diketahui dengan dua tolok ukur, yaitu : support dan confidence. Support (nilai penunjang) adalah persentase kombinasi item tersebut dalam database, sedangkan confidence (nilai kepastian) adalah kuatnya hubungan antara-item dalam aturan asosiasi. (Kusrini, Emha Taufiq Luthfi,2009 : 149).
Algoritma apriori dibagi menjadi beberapa tahap yang disebut narasi atau pass (Devi dinda setiawan, 2009) yaitu:
1.       Pembentukan kandidat itemset. Kandidat k-itemset dibentuk dari kombinasi (k-1)itemset yang didapat dari iterasi sebelumnya. Satu cara dari algoritma apriori adalah pemangkasan kandidat k-itemset yang subsetnya  berisi k-1 item tidak termasuk dalam pola frekuensi tinggi dengan panjang k-1.

2.       Penghitungan support dari tiap kandidat k-itemset. Support dari tiap kandidat k-itemset didapat dengan menscan database untuk menghitung jumlah transaksi yang memuat semua item didalam kandidat k-itemset tersebut.  Ini adalah juga ciri dari algoritma apriori dimana diperlukan penghitungan dengan cara seluruh database sebanyak k-itemset terpanjang.

3.       Tetapkan pola frekuensi tinggi. Pola frekuensi tinggi yang memuat k item atau kitemset ditetapkan dari kandidat k-itemset yang supportnya lebih besar dari minimum support.

4.       Bila tidak didapat pola frekuensi tinggi baru maka seluruh proses dihentikan. Untuk lebih memahami proses algoritma Apriori maka berikut ini akan diberikan illustrasi penggunaan algoritma Apriori. Dengan menggunakan database pada gambar 4 dan mengasumsikan minimum support adalah 2  transaksi.     

Apotek dan Alat-Alat Kesehatan
Pengertian Apotek menurut (Kepmenkes RI).No.1332/M ENKES/SK/X/2002 adalah suatu tempat tertentu, tempat di lakukan pekerjaan kefarmasian penyaluran perbekalan farmasi kepada masyarakat. Yang di maksud pekerjaan kefarmasiaan di antaranya pengadaan obat, penyimpanan obat, pembuatan sediaan obat, peracikan , penyaluran dan penyerahan perbekalan farmasi serta memberikan informasi kepada masyarakat mengenai perbekalan kefarmasian yang terdiri dari obat, bahan obat, obat tradisional, alat-alat kesehatan, dan kosmetik. (http://farmasismk.blogspot.com/2011/11/pengertianapotek html)

Analisa
Sistem informasi aktifitas penjualan dan pembelian alat-alat kesehatan di Apotek Kelambir 2 Medan sudah menggunakan komputer  dengan berbasis jaringan yang terpusat kedalam satu server.  Sistem informasi persediaan barang di Apotek ini terdiri dari pelayanan resep obat, penjualan obat dan alat-alat kesehatan serta gudang farmasi,.  Ditampilan gudang farmasi terdiri atas bagian persediaan, laporan pembelian, laporan penjualan. Data penjualan alat-alat kesehatan terdiri atas attribute nomor, tanggal, nomor slip, nama, jumlah barang, harga dan total harga. Untuk mendapat analisa data maka data  penjualan  di export kedalam database Microsoft excel karena bersifat spreadsheet sehingga sangat mendukung beberapa aplikasi data mining, dimana aplikasi data mining digunakan sebagai tempat uji coba atau implementasi. Data mining yang digunakan yaitu untuk mendapatkan informasi yang berharga dan berguna khususnya dalam penjualan alat-alat kesehatan.

Pembahasan
Analisis data dilakukan pada penjualan data alat kesehatan pada Apotek Kelambir 2 Medan ini bertujuan untuk menemukan pola penjualan alat-alat kesehatan, serta hubungan antar item jenis alat-alat kesehatan didalam transaksi. Tahap dalam menganalisa data dengan algoritma Apriori pada penjualan data alat-alat kesehatan dimulai dengan menyeleksi dengan cara membersihkan data data yang akan dianalisis, kemudian mencari semua jenis item nama alat-alat kesehatan yang ada didalam list transaksi penjualan, selanjut mencari jumlah setiap item yang ada pada setiap transaksi penjualan dari alat-alat kesehatan tersebut. Sesuai dengan support yang telah ditentukan maka terseleksilah beberapa item data yang memenuhi minimal support sesuai dengan jumlah item barang didalam transaksi, itu disebut pembentukan kombinasi satu item. Tahap selanjutnya dari item-item alat-alat kesehatan yang telah terseleksi dibentuk lah kombinasi dua item, maka terbentuk lah beberapa item data dengan kombinasi 2 item yang berbeda, dengan support yang ditentukan maka terseleksi lah beberapa data dua item, ini disebut pembentukan kombinasi dua item. Demikian seterusnya sampai kombinasi batas maksimal item transaksi. 

Pengujian
Untuk membuktikan data-data yang telah dihasilkan berupa pola hubungan kombinasi antar items dan rules-rules asosiasi sesuai dengan Algoritma Apriori maka perlu dilakukan pengujian dengan menggunakan suatu aplikasi. Aplikasi yang digunakan adalah Tanagra versi 1.4. Secara umum, cara menggunakan aplikasi Tanagra dimulai dengan mengklik menu File, New, muncul jendela untuk load database. Load database supaya masuk kesistem, klik menu icon define status dan atur parameternya, masukkan komponen frequent itemsets dan Apriori dan masukkan parameternya, kemudian execute, setelah view untuk melihat hasilnya.
Pengujian yang dilakukan pertama adalah pengujian untuk menghasilkan jenis item dan pola kombinasi dua items. Dengan paremeters adalah minimal support sama dengan 16 persen (%), maxsimal support sama dengan 100 persen (%), minimal length sama dengan satu, maksimal length sama dengan dua, dan itemset type sama dengan frequent.  Setelah dilakukan penentuan nilai parameter, maka dihasilkan jenis item dan pola kombinasi dua items. Setelah melakukan pengujian untuk menghasilkan jenis items dan pola kombinasi, mulai dari kombinasi dua items sampai dengan pola kombinasi lima items, maka pengujian yang dilakukan selanjutnya adalah pengujian untuk menghasilkan rules-rules, dimana rules-rules tersebut terbentuk dari pola kombinasi items pada pengujian sebelumnya. Pengujian yang dilakukan pertama adalah pengujian untuk menghasilkan rules-rules yang terbentuk dari pola kombinasi dua items.    Paremeters yang harus diisi adalah support sama dengan 16 persen (%), Confidence sama dengan 70 persen (%), maksimal card itemsets sama dengan dua. Jendela Association rules. Pada  pengujian untuk menghasilkan rules dari pola kombinasi dua items.  Rules diatas terdiri atas Antecedent, consequent, lift, support(%), Confidence (%). Antecedent adalah bentuk  kondisi dari pada rules, consequent adalah bentuk pernyataan dari pada rules, lift adalah menunjukkan adanya tingkat kekuatan rules kejadian acak dari antecedent dan consequent berdasarkan pada support masing-masing, support adalah persentasi kombinasi items tersebut, sedangkan confidence adalah kuatnya hubungan antar items dalam aturan asosiasi.

Kesimpulan
Berdasarkan pembahasan yang telah dilakukan  dengan algoritma Apriori dan dilakukannya  pengujian dengan aplikasi Tanagra maka penulis menarik beberapa kesimpulan yang penting. Adapun kesimpulan-kesimpulan tersebut adalah sebagai berikut: 1. Data Mining dapat di implementasikan dengan menggunakan Database penjualan alat-alat kesehatan karena dapat menemukan kecenderungan pola kombinasi itemsets  sehingga dapat dijadikan sebagai informasi yang sangat berharga dalam pengambilan keputusan untuk  mempersiapkan stok jenis  barang apa yang diperlukan kemudian. 2. Penerapan Algoritma Apriori  pada teknik Data Mining sangat efisien dan dapat mempercepat proses pembentukan kecenderungan pola kombinasi itemset  hasil penjualan alat-alat kesehatan di Apotek Kelambir-2 Medan, yaitu dengan support dan confidence tertinggi adalah Stick Asam Urat -  Stick Gula dan Stick Colestrol- Stick Gula.

Saran
Untuk kepentingan lebih lanjut dari penulisan tesis ini maka penulis memberikan beberapa saran sebagai berikut : 1. Data mining dengan Algoritma Apriori memiliki kelemahan karena harus melakukan scan database setiap kali iterasi, sehingga untuk database yang sangat besar membutuhkan waktu yang lama. 2. Penerapan algoritma Apriori sangat praktis namun perlu dilakukan perbandingan dengan algoritma lain, untuk menguji sejauh mana Algoritma  Apriori masih dapat diandalkan untuk memproses dan menemukan pola hubungan (asosiasi) antar item pada database  berskala besar. 3. Dalam penggunaan algoritma Apriori di perlukan pemahaman tentang  aturan Asosiasi dan Data Mining dan cara menjalankan aplikasi sofware Tanagra 1.4.48.

Daftar Pustaka

Pratima Gautam, and K. R. Pardasani. Efficient Method for Multiple-Level Association Rules in Large Databases. Journal of Emerging Trends in Computing and Information Sciences. VOL.2  No.12. December 2011.

Abdullah Saad Almalaise Alghamdi., Efficient Implementation of  FP Growth Algoritma- Data Mining on Medical Data. International Journal of Computer Science and Network Security, VOL.11 No.12, December  2011.

Sanjeev Rao, and Priyanka Gupta. Implementing Improved Algorithm Over Apriori Data Mining Association Rule Algorithm. International Journal of Computer Science and Technology (IJCST)-VOL.3 Issue 1, Jan-March 2012.

OTHMAN YAHYA, OSMAN HEGAZY, and EHAB EZAT. An Efficient Implemantation of Apriori Algorithm Based on HADOOPMAPREDUCE Model. International Journal of Reviews in Computing (IJRIC)-VOL.12, December 2012.

Jogi. Suresh, and T. Ramanjaneyulu. Mining Frequent Itemsets Using Apriori Algorithm. International Journal of Computer Trends and Technology (IJCTT)-VOL.4 Issue4-April 2013.

Shuruti Aggarwal, and Ranveer Kaur. Comparative Study of  Various Improved Versions of Apriori Algorithm. International Journal of Engineering Trends and Technology (IJETT)-VOL.4 Issue4-April 2013.

Prof. Paresh Tama., and Dr. Yogesh Ghodasara. Foundation for Frequent Pattern Mining Algorithms’ Implementation. International Journal of Computer Trends and Technology (IJCTI)-VOL.4 Issue 7 - July 2013.