Unicode工作小組93年度工作成果

 

Unicode工作小組93年度工作成果

更新日期:2005/1/31

為因應Unicode字碼日益普遍應用於圖書館界之趨勢,使多國語文的資料能正常顯示,臺灣地區INNOPAC系統使用者聯盟於民國93年4月組成Unicode工作小組,由聯盟成員館自願報名加入工作小組,參與的單位包括中央研究院計算中心及文哲所圖書館、臺灣大學圖書館、政治大學圖書館、逢甲大學圖書館、朝陽科技大學圖書館、臺北醫學大學圖書館及國家圖書館等七所圖書館。該小組由國家圖書館書目資訊中心負責召集,自93年6月至12月間共計召開8次會議,由各館指派代表共同討論,以解決圖書館自動化系統中文字碼轉換為Unicode可能遭遇的問題。與會人員來自各館編目組、資訊組、系統資訊組、採錄組、閱覽組及書目資訊中心等單位,結合系統管理者、建檔者及使用者,會議期間亦邀請字碼專家宋玉先生與會指導並提供諮詢。

在宋玉先生及Innovative Interfaces Inc.提供的字碼對照表基礎上,該小組93年的工作重點在於查核彙整不同來源的對照表,以修訂出CCCII及Unicode雙向轉換對照表,作為圖書館界共同遵循的字碼轉換標準。工作小組討論過程中發現問題較大的是多碼對一字形的CCCII與Unicode互轉的過程,從多碼對一字形的CCCII轉換為Unicode較無對應問題,但從Unicode轉換回CCCII時,必須在多個CCCII碼中選定一個對應的內碼。由於對應表的查核相當耗費人力時間,為及早將對應表提供各界利用,小組成員決議優先整理相同一個字形,其Unicode對應至多個CCCII的問題。各館代表依據共同訂定的選碼原則,以分工方式逐字依據下列工具查核對照表,以求較完整蒐集目前應用於各資料庫的CCCII碼:

  • 中文資訊交換碼/行政院文化建設委員會資訊應用國字整理小組編;張仲陶主編. 第二冊第三版. 臺北市:行政院文化建設委員會,民74[1985](民81,重印)

  • 中文資訊交換碼/行政院文化建設委員會資訊應用國字整理小組編;張仲陶主編. 第三冊. 臺北市:行政院文化建設委員會,民76.

  • 中文資訊交換碼異體字表/資訊應用國字編委會編. 第一次綜合修訂稿. 臺北市:行政院文建會,民81.

  • The Unicode standard, version 4.0 : the Unicode consortium / edited by Joan Aliprand ... [et al.]. Boston, MA : Addison-Wesley, c2003.

  • Unihan Database(http://www.unicode.org/charts/unihansearch.html

  • CNS11643中文標準交換碼全字庫(http://www.cns11643.gov.tw

  • 運用PN300查核昌泰中文內碼

該小組於93年度查核修訂完成1,325組多碼(CCCII)對一字(Unicode)的對應表,該表總計蒐集2,906個CCCII碼。此外,並將各個來源的對照表彙集為可對應Unicode之CCCII碼計27,436個;可對應CCCII之Unicode碼計有25,868個。本(94)年度的工作計畫除了上述對照表之推廣應用外,亦將包括持續進行新增Unicode之增補及對應,Unicode簡繁字對照表之整理等相關事項。字碼整理過程相當繁瑣,期望有更多熱心的同道加入整理工作,以便早日讓各圖書館順暢步入Unicode環境。(國家圖書館書目資訊中心許靜芬)

 

發布日期:2001年01月01日 最後更新:2018年12月18日