使用資料探勘探討多層式圖書自動分類系統之研究

作者
吳慧貞
指導教授
郭俊桔
畢業學校
中興大學
畢業系所
圖書資訊學研究所
學位類別
碩士
畢業學年度
103
內容
圖書資料分類編目作業,為各級圖書館經營管理的核心,亦是最重要的基礎工作;例行性的分類編目事務,便是由館員依文意與內容主旨,決定該館藏所屬類別。但是國內的圖書館館員多半為圖書資訊領域背景,卻必須負責所有到館圖書的編目,因此常常有因為學科背景不足,造成分類困難的情形。再加上,近年各個學科領域皆有長足進步,圖書出版的數量大幅度增加,造成編目館員負擔日益沉重,除了影響新進館藏之上架時程外,更容易因為受到主觀認知差異性的影響,導致產生inter-consistency和intra-consistency一致性低落等編目品質問題。 本研究探討傳統單層式圖書分類系統的作法,並結合多種分類器的優點,提出使用投票策略之多層式圖書自動分類系統。為了探討多層式圖書分類系統的效能,分別使用兩種語料集(博碩士論文、網路書店書目)及其對應至圖書分類號的資料,作為訓練與測試語料。同時,針對博碩士論文的文件內容,探討各種內容組合對於文件特徵值擷取的影響後,找出應用於圖書自動分類之最佳內容組合。另外,針對各種分類器的組合,進一步探討多層式圖書分類器的最佳組合。最後,實驗結果證實,多層式圖書分類系統的正確率達99%,比傳統的單層式圖書分類系統,具有更佳的分類效能。
網址連結
發布日期:2018年09月13日 最後更新:2018年12月18日