以大眾分類法為基礎之網站內容分類架構—以社群書籤網站為例

作者
林慶文
指導教授
皮世明
畢業學校
中原大學
畢業系所
資訊管理研究所
學位類別
碩士
畢業學年度
95
內容
自動化文件分類技術在知識管理領域應用相當廣泛,傳統上自動化文件分類技術主要以兩大方向進行。第一種方向是以關鍵字為基礎的分類方法,例如早期的TFIDF以及近幾年應用廣泛的支援向量機方法(SVM)等。但是以關鍵字為基礎的分類分法卻擁有關鍵字語意不清問題。第二種方向則是以語意分析為基礎的分類方法,早期是以關鍵字的語意分析為主,而近幾年有專家學者提出以本體論解決語意問題,但本體論在建構上卻有專家知識領域代表性的疑慮,較無客觀的建構方法。因此,大眾分類法(Folksonomy)便是在Web2.0的衝擊與眾多分類問題之情況下衍生的分類概念,以廣大的使用者取代以往專家定義資訊的現象。但大眾分類法仍是以關鍵字為基礎,依舊有語意上的問題。故本研究提出一個大眾分類權重機制,應用於社群書籤網站。期望能解決大眾分類在語意同義字及分類效果不佳的問題。 為了改善大眾分類效果之問題,本研究擬提出一個大眾分類的權重機制應用於社群書籤網站上。首先在使用者訂定個人書籤時,會自動收集個人書籤之標籤關鍵字(Tag)。接著將標籤關鍵字進行斷詞處理,再利用WordNet詞彙庫查詢同義詞之相關詞彙。最後運用TFIDF詞彙計算的概念,計算出同義詞的分類權重值及進行細項的調整後即完成分類的動作,並將分類結果列表供使用者查詢。 研究結果顯示,本研究提出的大眾分類權重機制,有效縮減標籤分類的數量達百分之三十以上,且明顯改善標籤分類之品質及增加使用者的滿意度。表示本研究提出的大眾分類權重機制,可有效的改善大眾分類中語意同義字以及分類效果不佳等問題。
網址連結
發布日期:2018年09月13日 最後更新:2018年12月18日