口語語料庫之建置典藏與應用:以臺灣客語口語語料庫為例

作者
王勻芊
指導教授
蔡明月、賴惠玲
畢業學校
國立政治大學
畢業系所
圖書資訊與檔案學研究所
學位類別
碩士
畢業學年度
104
內容
多語族社會下的臺灣,各種語言使用反映臺灣文化的多元。語言不僅是溝通工具,更是文化的載體。然而由於社會變動、經濟發展、文化流動及語言使用,造成臺灣華語仍然是臺灣社會最強勢的語言,臺灣閩南語、臺灣客語、原住民語的不同族語相對較於弱勢,而現行的語言政策及語用實際狀況的落差,以及不同語言及次方言之間相互影響或排擠等因素,更造成這些語言快速消失,導致臺灣語言及文化的多樣性降低,因此語言典藏及保存實是刻不容緩。其中,建置語料庫以提供長期且穩定的語言典藏及研究,是臺灣當前語言政策措施之外,可行而有效的方法之一。有鑑於臺灣的客語正面臨逐漸消失的危機,全球第一個以臺灣客語口語為主的語料庫──「臺灣客語口語語料庫(The NCCU Corpus of Spoken Hakka)(http://140.119.172.200/)」的建置及維護,便具有相當高的前瞻性,且該語料庫仍屬於一個成長的有機體,其應用層面是有可塑性的。 本研究分析「臺灣客語口語語料庫」的建置、典藏及應用。主要目的為:(1)探討語料庫的意義、價值、原理和內涵;(2)概述國內外語料庫的案例、探討語料庫建置典藏與應用文獻,及分析語料庫架構和建置模式;(3)分析「臺灣客語口語語料庫」的建置與典藏;(4)探究「臺灣客語口語語料庫」的加值與應用。語料包含「對話」和「獨白」兩類型,截至2016年6月共收錄83筆語料。主題式對話是由兩至三位語料發音人不限主題以聊天的方式自由進行談話,語料發音人來自桃園(楊梅、新屋、中壢、觀音、平鎮)、新竹、苗栗、臺中(東勢)、高雄(美濃)、屏東、花蓮等地區,涵蓋臺灣客語四縣、海陸、大埔、饒平等不同次方言的口語,經轉寫並完成第二次校訂的語料有15筆公開在本網站。口述故事由單一語料發音人獨自完成,以Mercer Mayer的Frog, where are you?為引,請年輕的客家子弟用客語「看圖說故事」,本網站已公開4筆。另有29筆轉寫完成之語料待公開、35筆語料整理中(截至2016年6月16日)。本研究以跨學科的角度探討語料庫的功能、口語語料庫的作用,利用個案研究法以及內容分析法,剖析臺灣客語口語語料庫的建置、典藏之流程,再由語料的後設資料,以量化呈現此語料庫的建置內容,並進一步探討語料庫未來的應用,達到語料加值的目的。研究最後以臺灣客語口語語料庫應用於教學為例,建議擷取口語語料日常會話的影音編輯,做為聽力及會話的學習材料,提供學習者生活化及道地的客語使用。本研究希望透過對「臺灣客語口語語料庫」的詳盡介紹,能揭示本語料庫對臺灣客語典藏、保存的重要性。
網址連結
發布日期:2018年09月13日 最後更新:2018年12月18日