Computer File
Analisis aturan asosiasi dari data akses website (log server) pada sistem terdistribusi hadoop
Sebuah log akses server mencatat permintaan-permintaan yang dilakukan oleh pengguna dari sebuah server website. Di dunia di mana internet sudah berkembang, sebuah website dapat diakses oleh ribuan bahkan jutaan pengguna setiap harinya dari seluruh penjuru dunia. Selain itu, untuk satu orang pengguna hampir tidak mungkin hanya menjelajah satu halaman tertentu dari sebuah website. Hal tersebut membuat dalam satu hari, sebuah log akses website dapat menghasilkan data dari puluhan megabyte hingga puluhan gigabyte (Big Data) bergantung dari banyaknya permintaan akses server website yang dilakukan pada hari itu. Dari sebuah data akses log server website tersebut sebenarnya terdapat informasi-informasi penting yang terkandung di dalamnya.
Data tersebut dapat diambil dan dianalisis untuk dijadikan bahan-bahan pertimbangan yang dibutuhkan oleh pemilik website. Bahan pertimbangan tersebut contohnya dalam segmentasi pengguna website, strategi pemasaran untuk website komersial, ciri-ciri pengguna website, pemberian sugesti pada pengguna berdasarkan apa yang dilakukan pengguna lain, dan lain-lain. Informasi-informasi tersebut nantinya dapat digunakan oleh pemilik website dalam meningkatkan pelayanan website kepada setiap penggunanya. Misalkan dengan memberi sugesti kepada seorang kustomer yang membeli sepatu lari dari website untuk membeli celana lari karena mayoritas orang yang membeli sepatu tersebut juga membeli celana lari.
Pengambilan dan analisis data seperti di atas, dapat dilakukan dengan metode analisis aturan asosiasi pada data log akses sebuah server dengan menggunakan algoritma FP-Growth. Untuk sebuah data yang berukuran sedang, algoritma FP-Growth dapat dijalankan pada sebuah komputer saja dengan waktu yang relatif cepat. Namun untuk Big Data memerlukan waktu yang cukup lama. Hadoop diperlukan sebagai struktur kerja yang memungkinkan dilakukannya pengkoputasian secara paralel pada banyak komputer agar algoritma FP-Growth dapat berjalan dengan waktu yang dapat diterima. Untuk itu dibutuhkan sebuah algoritma FP-Growth yang berjalan pada lingkungan MapReduce pada Hadoop.
Pada penelitian ini, telah berhasil dikembangkan sebuah perangkat lunak yang melakukan analisis aturan asosiasi dengan menggunakan algoritma FP-Growth yang berjalan pada MapReduce pada Hadoop. Dari empat variabel eksperimen pada skripsi ini, tiga variabel memengaruhi waktu eksekusi yaitu nilai minimum support, ukuran blok HDFS, dan banyaknya node pada cluster sedangkan nilai minimum confidence tidak.
Kata-kata kunci: Aturan Asosiasi, Hadoop, FP-Tree, FP-Growth, Apache
Barcode | Tipe Koleksi | Nomor Panggil | Lokasi | Status | |
---|---|---|---|---|---|
skp33045 | DIG - FTIS | Skripsi | INFO BAG a/16 | Perpustakaan | Tersedia namun tidak untuk dipinjamkan - Missing |
Tidak tersedia versi lain