Computer File
Algoritma analisis aturan asosiasi apriori paralel dengan map reduce pada sistem terdistribusi hadoop
Sebuah sistem terdistribusi adalah salah satu dampak kemajuan teknologi yang dapat memenuhi kebutuhan manusia untuk mengolah data yang berukuran sangat besar atau big data. Hadoop adalah contoh kerangka kerja yang dapat menjalankan perangkat lunak dengan sistem yang terdistribusi. Hadoop adalah salah satu kerangka kerja yang dirancang untuk memproses dan menganalisis data yang sangat banyak. Hadoop memiliki komponen-komponen yang dapat mengolah data di banyak komputer dalam satu waktu secara paralel. Sehingga waktu yang dieksekusi selama pemrosesan data menjadi minimum.
Penambangan data adalah suatu proses dengan mencari, menggali, dan membuat korelasi dari suatu data yang banyak. Tujuan penambangan data adalah untuk mencari pola yang berharga dan bernilai tinggi untuk mendapatkan sebuah pengetahuan baru maupun pengetahuan tambahan. Pola yang dibahas dalam penelitian ini adalah pola aturan asosiasi. Aturan asosiasi adalah sebuah aturan berupa prosedur atau fungsi yang memetakan hubungan antar data berdasarkan frekuensi kemunculannya. Tujuan aturan asosiasi adalah untuk mencari korelasi antar data dari kumpulan data. Manfaat dari aturan asosiasi adalah mengetahui pola-pola data yang saling berkesinambungan satu sama lainnya. Aturan asosiasi menambah pengetahuan dan dapat membantu pengambilan keputusan.
Algoritma Apriori adalah salah satu algoritma penambangan data yang memproses data masukkan menjadi aturan asosiasi. Algoritma Apriori menerima data masukkan yang berupa data transaksi maupun data yang memiliki indeks atau pun nama barang. Algoritma Apriori memiliki tingkat kecepatan yang cenderung lambat karena banyaknya pengulangan yang dilakukan untuk menambang pada proses penambangan data. Karena Algoritma Apriori cenderung lambat dan membutuhkan banyak waktu untuk pemrosesan data, maka pada penelitian ini penulis membangun sebuah perangkat lunak yang mengimplementasikan Algoritma Apriori dengan menggunakan Hadoop untuk menjalankan Algoritma Apriori secara paralel. Algoritma Apriori Paralel adalah sebuah Algoritma Apriori yang berjalan di lingkungan Hadoop dan menggunakan MapReduce sebagai kerangka kerja pengolahan datanya. Algoritma Apriori Paralel dapat dijalankan di beberapa komputer sekaligus sehingga dapat menghemat banyak waktu. Penghematan waktu tersebut tergantung pada variabel-variabel pada konfigurasi Hadoop tersebut maupun pada Algoritma Apriori.
Penelitian yang telah dilakukan adalah penelitian dengan menggunakan perangkat lunak yang mengimplementasikan Algoritma Apriori Paralel, melakukan eksperimen pada perangkat lunak tersebut, dan mencatat waktu yang dibutuhkan oleh perangkat lunak untuk memproses data masukkan. Eksperimen dilakukan dengan menjalankan perangkat lunak yang mengimplementasikan Algoritma Apriori Paralel untuk mengolah data yang berukuran lebih dari 500 megabytes. Perangkat lunak tersebut dijalankan secara paralel pada maksimal 25 komputer untuk kebutuhan eksperimen.
Berdasarkan hasil eksperimen dapat dibuktikan bahwa Algoritma Apriori Paralel pada lingkungan Hadoop dapat menghasilkan aturan asosiasi yang sesuai dengan aturan asosiasi yang dihasilkan dengan menggunakan Algoritma Apriori. Selain itu, juga dibuktikan bahwa beberapa variabel pada konfigurasi Hadoop dan Algoritma Apriori dapat memengaruhi waktu yang dibutuhkan untuk analisis data. Dari waktu pencatatan hasil eksperimen yang telah dilakukan, dapat diketahui bahwa jumlah waktu yang dibutuhkan untuk menjalankan Algoritma Apriori Paralel menghemat waktu hingga 60% ketika dijalankan pada 6 komputer secara paralel. Akan tetapi penghematan waktu tersebut tidak bertambah secara drastis ketika menjalankan Algoritma Apriori Paralel pada 7 komputer atau lebih. Hal itu disebabkan oleh besaran data masukkan pada eksperimen hanya 1.12 gigabytes.
Kata-kata kunci: Sistem Terdistribusi, Apriori, Apriori paralel, Hadoop, MapReduce, Penambangan Data
Barcode | Tipe Koleksi | Nomor Panggil | Lokasi | Status | |
---|---|---|---|---|---|
skp33046 | DIG - FTIS | Skripsi | INFO KUR a/16 | Perpustakaan | Tersedia namun tidak untuk dipinjamkan - Missing |
Tidak tersedia versi lain