Computer File
Ekstraksi informasi tempat kunjungan dari artikel berbahasa Indonesia
Informasi adalah data yang telah telah diolah dan memiliki makna. Sebuah informasi dalam bentuk digital umumnya tersimpan pada dokumen tidak terstruktur sehingga sulit untuk dimengerti. Informasi dapat dimengerti lebih mudah apabila disajikan secara terstruktur. Informasi yang disajikan secara terstruktur disebut juga informasi terstruktur. Proses untuk mendapatkan dan menampilkan informasi terstruktur dari sebuah dokumen tidak terstruktur dapat dipermudah dengan menggunakan teknik ekstraksi informasi. Pada penelitian ini, digunakan 2 teknik ekstraksi informasi, pengenalan entitas bernama dan co-reference resolution, pada pembuatan sebuah perangkat lunak ekstraksi informasi. Perangkat lunak bersifat domain specific dan language spesific. Domain untuk perangkat lunak yang dibangun adalah tempat kunjungan dan bahasanya adalah bahasa Indonesia. Untuk melakukan pengenalan entitas bernama, digunakan konsep model Markov tersembunyi dan algoritma Viterbi. Untuk melakukan co-reference resolution digunakan konsep aturan asosiasi. Hasil dari penelitian ini adalah sebuah perangkat lunak ekstraksi informasi untuk mendapatkan informasi yang ada pada sebuah dokumen dalam bentuk artikel teks. Informasi yang didapat dimasukan ke dalam template informasi terstruktur dan kemudian ditampilkan oleh perangkat lunak. Perangkat lunak dibuat dalam bahasa pemrograman Java. Evaluasi pada perangkat lunak menggunakan nilai recall dan dilakukan untuk setiap komponen ekstraksi informasi. Komponen pengenalan entitas bernama memiliki nilai recall sebesar 72% dan komponen co-reference resolution sebesar 79%.
Kata-kata kunci: Ekstraksi Informasi, Pengenalan Entitas Bernama, Co-reference Resolution, Model Markov, Model Markov Tersembunyi, Algoritma Viterbi, Aturan Asosiasi
Barcode | Tipe Koleksi | Nomor Panggil | Lokasi | Status | |
---|---|---|---|---|---|
skp33384 | DIG - FTIS | Skripsi | INFO DEV e/16 | Perpustakaan | Tersedia namun tidak untuk dipinjamkan - Missing |
Tidak tersedia versi lain