以維基百科為基礎之中文縮寫詞與同義詞庫建構
作者 | |
---|---|
出版日期 | 2015.04 |
內容 | 雖然過去對於辨識縮寫詞已有不少研究,但其研究範圍並未包含概括縮詞,此外,面對不斷增長及變化的詞彙,已成為資訊檢索及詞庫維護最大的問題。有別於過去以統計方式處理,本研究以維基百科的內文組成結構為基礎,提出數項創新且輕量級同義詞配對識別法。由於同義詞並沒有絕對客觀的標準答案可資核對,為驗證本研究所提出方法是否有效,我們進行兩階段包含主客觀方式評量。實驗結果顯示本研究所提出的方法,除了能有效萃取出縮寫詞、異形同義及同形異義詞之外,還能夠識別出過去研究無法解決的概括縮詞。在第一階段評量平均精確率為 72%、召回率 82%,其中縮寫詞的精確率高達 92%,概括縮詞的召回率為 90%。第二階段評量結果,使用者接受度亦達 91%。在效率方面,平均找出 1組同義詞只需要 0.01 秒。 |
刊名 | 資訊管理學報 |
卷期 | 第22卷第2期 |
頁數 | 頁117-140 |
網址連結 |
發布日期:2018年09月13日 最後更新:2018年12月18日