利用 WorldCat 的館藏資料來彌補 Wikipedia 裡的一些缺漏
Wikipedia 的涵蓋範圍和內容已經超過很多人的想像,但畢竟還是有很多缺漏的角度需要彌補。尤其在最近國際上頗為關注的性別, 族群問題上,除了有關女性人物和議題的主題明顯失衡以外,在 Wikipedia 上身為女性的參與編輯者的比例也相對較低。本篇報導描述 OCLC 的研究人員嘗試用 Worldcat 的館藏資料來做出一些貢獻。
首先想到的當然是 OCLC 所擁有的大量名稱權威(Name Authority)檔案,包含 Worldcat Authority Files, Virtual International Authority File 以及 WorldCat Identities。然而這些資料本身並不盡然包含性別,族群或者國籍的相關資料。在 Wikipedia 的內容增長的過程中,透過學識廣泛的熱心人士手工產生的各種內容增補清單,接著讓學有專精的編輯者根據清單來增補內容一直是很重要的一個推動力。例如 女性手工藝藝術家 (Women Crafters) 清單 就以國別的方式分別列舉了等待增補內容的女性手工藝藝術家。
透過這類清單的啟發,OCLC 研究人員找到了努力的方向。將原先透過分析名稱權威檔來自動產生清單的方式,改成透過館藏清單來輔助調整這些增補清單,讓編輯者根據出版品比較多,或者被討論比較多的角度來調整增補內容的先後次序。(參考這類資料的同時,我們也要注意圖書館有自己的館藏政策,在購書的方向上也無法避免有意無意的偏頗。再者,OCLC 資料雖然已涵蓋多數圖書館的資料,但是並不代表包含了世界上所有的圖書館。同時,某些作家的作品沒有被出版或者不被討論因此沒有被收藏,也不盡然表示這個作者不夠知名。)
底下是 WorlCat Identities 裡針對 張愛玲 所列出的資料頁面。透過有多少圖書館收藏了她以及有關她的作品,多少可以看出她的知名度和重要性。(橘紅色的代表作品被收藏的數量, 綠色的是她過世後才出版的作品被收藏的數量,而藍色的則是有關張愛玲的出版品的數量。透過年代的排列可以看出隨者時間嬗遞,知名度和出版品收集量的變化。註: 本圖表是透過 輸入 "Eileen Chang" 以後,選擇 Eileen Chang Chinese Writer and Screenwriter 後取得 )