社群資料對圖書搜尋系統效能之研究

作者
陳恒毅
指導教授
柯皓仁
畢業學校
國立臺灣師範大學
畢業系所
圖書資訊學研究所
學位類別
碩士
畢業學年度
102
內容
隨著Web 2.0的風潮,社群資料(Social Data)被廣泛應用於各類型的網站,其中網路書店、網路書櫃等書目社群網站迅速累積了大量由使用者產生的社群資料。而INEX (INitiative for the Evaluation of XML retrieval)自2011年開始自Amazon、LibraryThing搜集整理包含社群資料的書目資料,並做為圖書搜尋任務之測試資料集。 本研究利用實驗法以INEX 2013圖書與社群搜尋任務的測試資料集進行圖書搜尋實驗,並探究不同欄位對搜尋結果以及應用社群資料重新排序結果之影響。在實驗中分別以傳統書目資料、社群資料和兩者合併的資料製作索引,並以社群資料將搜尋結果重新排序。主要之研究結果如下: 1. 運用社群資料在機率模型的圖書搜尋,比目前圖書館使用的傳統書目資料,可以得到更好的檢索效能。 2. 社會評論資料(Review)在機率模型的檢索之中,可以得到最好的結果。 3. 社會標記(Tag)的資料在機率模型的檢索之中,與傳統書目資料並無明顯的差異,但是以被標記次數做為權重調整之後,其檢索效能提升270%,明顯高於未權重調整前之結果,僅次於社會評論資料索引。 4. 使用社會評論將圖書搜尋結果重新排序,可以得到本研究中最好的檢索結果,可以提升3.1%的nDCG分數。 5. 使用社會標記將圖書搜尋結果重新排序,其結果不如使用社會評論重新排序的結果,但是其對圖書搜尋效能可以最高提升25%的nDCG分數。 前述之研究結果可進一步應用於資訊系統的設計,包含圖書搜尋、推薦系統,期使讀者有更好的使用者經驗。
網址連結
發布日期:2018年09月13日 最後更新:2018年12月18日