web_admin@stts.edu

Jalan Ngagel Jaya Tengah 73 - 77, Surabaya, Indonesia

+62 31 504 1509, +62 31 503 1881

+62 31 502 7920

Detail Postingan

Studi Analisis Latent Semantic Indexing Untuk Information Retrieval

Latent Semantic Indexing (LSI) adalah salah satu model dari Information Retrieval System yang merupakan pengembangan dari Vector Space Model (VSM). LSI merepresentasikan term dari dokumennya dalam bentuk vektor-vektor yang menyusun term document matrix. LSI sebagai model IR System memiliki kelebihan dalam menangani masalah polisemi dan sinonim dalam kata yang sering ditemui dalam koleksi dokumen. Dalam prosesnya untuk mengatasi masalah polisemi dan sinonim yang dilakukan oleh LSI adalah dengan memperhitungkan hubungan antar term yang satu dengan yang lain dan hubungan antar term dalam suatu dokumen dengan term-term dalam dokumen yang lain. Hal ini dilakukan dengan dekomposisi terhadap term document matrix sebagai inverted file dari LSI untuk mendapatkan hubungan antar term tersebut. Sehingga dokumen yang relevan walau tidak mengandung term dari query pun tetap dapat dihasilkan. Untuk melakukan dekomposisi terhadap matrix terdapat dua metode, yaitu dengan menggunakan metode Singular Value Decomposition (SVD) atau dengan menggunakan Semi Discrete Matrix Decomposition (SDD). Tugas akhir ini akan membahas LSI secara menyeluruh dengan SVD dan SDD sebagai metode dekomposisinya beserta uji coba yang dilakukan terhadap beberapa jenis koleksi dokumen. diantaranya adalah koleksi dokumen MedLine, Kitab Markus dari Kitab Suci Perjanjian Baru dan koleksi dokumen dari ringkasan komik.