台語文字的字型發展現況(上)

台語的缺字現狀

大家好我是台科大模型工廠工讀生陳建中,這篇文章不討論做模型,而跟大家討論台文的字型議題。

前言

2020年是台文走入社會的一年:二月蘇貞昌的一粒卡臣貼文引起的一系列台語正字爭議、三月小王子台語版出版、四月jf粉圓1.1更新以及源樣系列字型1.5更新、六月意傳台文輸入法開始試用、七月敢按呢迷因網路爆紅、八月我咧唱歌出版…… ,每個月都有關於台語的新聞與事件在台灣發生,母語復振的議題也開始受到社會較多的關注與討論,台語開始進入印刷品、媒體、網路,台語的文字風景逐漸開始起造。

本文接續我的前篇文章《為什麼台北黑體的行銷宣傳不恰當》文末所提及的台語議題,討論台文的字型發展現況。
文章分為上下兩篇:上篇介紹台語目前通行的三種文字系統與台語正面臨的缺字狀況,下篇則介紹台語的字型發展現況。

台語文字的字型發展現況(上)-台語的缺字現狀
台語文字的字型發展現況(下)-台文書寫字型選用推薦與比較

願這篇文章能成為台語與字型兩個領域之間的橋樑,建立台文使用族群選擇適當電腦字型的意識、也使字型產業工作者得以了解台文族群的字型需求。

本篇文章中若寫到𪜶(⿰亻因)、𬦰(⿰⻊百)、𰣻(⿸疒哥)等一般人瀏覽器通常會缺字的字符時,會額外以括號註記表意文字描述序列(IDS)表示其漢字結構。前方的字符型狀表達後方的漢字部件排列關係,可以參考下表說明。

表格擷取自維基百科

預防針與聲明

本文僅針對台語的字型做出論述,並簡介台語的書寫現況。
文章中所提及的「台語」即教育部所稱的「臺灣閩南語」,如果讀者具有與本文相衝突的價值觀與意識形態,或是不太清楚相關議題,可以先閱讀師大台文系劉承賢教授所撰寫的《關於「台語」、「台語文」的疑問與除魅》一文,我原則上不會對相關問題多做回應。

另外,文中資料為本人的整理與詮釋,或許仍有錯誤,我在文章中會盡量列出所有的參考資料,若有過於片面的見解或需要改進的地方還請見諒,請讀者發現問題時務必留言跟我說。

台語的文字系統與用的字

台語經歷多年的演進,現今仍通行著三種文字系統:漢字台羅白話字(教羅)。書寫上則有全漢全羅漢羅並行三種派別,而漢字兩種羅馬字排列組合下來共有五種書寫方式

漢字

漢字作為台語的載體最早可以追溯到明嘉靖丙寅 45 年的戲劇本《荔鏡記》,百年來都是台語的主流文字之一。今年出版的小王子台語版以及我咧唱歌都是以全漢字書寫的台語書籍,教育部每年所舉辦的閩南語語言能力認證也是漢字為主的台語檢定。

具有官方性質的臺灣閩南語常用詞辭典(教典)收錄了兩萬多則詞條,由教育部國語推行委員會編輯與認定官方正字,而民間另有 ChhoeTaigi 找台語整理了各種典籍集結而成的台語字詞資料庫,一共有三十二萬多則詞條。

以上當然還不是台語漢字的全部,民間還能夠找到各種民間俗字,如位在公館,蒐集大量台灣本土書籍的獨立書店臺灣e店,其招牌上的"ê"(⿱入下)就是一個讀作「ê」、意義同「的」的漢字,僅收錄在全字庫,尚未被納入 unicode 編碼中。

台灣ê店的第三個字是一個意思和「的」相同的異用字,僅全字庫有收錄

白話字 Pe̍h-ōe-jī(POJ)

白話字自 19 世紀由傳教士所創,最初作為傳教之用,廣泛流通於教會之中,所以又被稱為「教會羅馬字」,而後也因為拉丁字母相較於漢字學習門檻低非常多,不識字的人也能快速上手,白話字也進而被用於各種非宗教用途的書寫。

白話字曾經是台灣社會中廣泛被使用的文字系統與知識載體,直到 1970 年國民政府全面禁止使用白話字才漸漸式微,近代解嚴後才再次的重新推廣。更詳細的白話字歷史,可以閱讀陳慕真於 2015 年的博士論文《白話字的起源與在台灣的發展》

雖然今日教育部以及國小的鄉土語言教學現場則是以台羅為準,但也因為白話字擁有非常多的歷史文獻,是台語研究相當重要的文字系統,民間有相當多的白話字愛好者以白話字書寫,如阿勇台語是個使用全白話字字幕的Youtube 頻道;還有民報台語世界專欄,當中的每篇文章都是以白話字漢羅與全白話字書寫。

白話字使用的符號除了拉丁字母 a~z 之外,還有五個附加符號表示聲調,如á、à、â、ā、a̍ 。還有兩個變體字母「 o͘ 」與「 ⁿ 」表示 [ɔ] 母音(相當於注音「ㄛ」)以及鼻音。

圖片擷取自維基百科

教育部台羅 Tāi-lô(TL)

80 年代解嚴之後,母語議題始得被社會討論,民間各方有志之士開始投身於改良台語羅馬字系統,或是基於各種需求與理念自創拼音文字,形成每個人各成一派,百家爭鳴的盛況:光是維基百科目前有整理與比較的系統就多達17種,其後再經歷多年的整併,才整合至現今的台羅與白話字兩種系統。
整併過程中充滿各種精彩的政治角力與學術論戰,相關歷史可以進一步閱讀陳德修 2019 年的碩士論文《Tâi-oân-ōe án-tsuánn寫》,裡面有相當精彩的文獻考察與採訪。

教育部最終公布的《臺灣閩南語羅馬字拼音方案》TLPA與白話字整合而來,與白話字具有良好的相容性。

台羅是目前教育現場、公視台語台、教典等各種媒介所使用的文字與標音系統,除了前面提到的小王子與我咧唱歌當中使用台羅標音之外,2018 年出版的《Tsiâ偷食菜頭粿》是一本漢羅混寫的兒童繪本,可以從此書中瞥見台羅不只是音標,而作為文字的一面。

內容擷取自維基百科
內容擷取自維基百科

台語的缺字難關

在字型公司 justfont 的 podcast 節目字型腦補S1E8 中,But ko 與 BBC 提及了「要討論字型議題,先看看桃園機場的新細明體吧!」
而討論台文的字型議題,就容我先帶大家看看蔡英文總統的國慶演說吧!

國慶演說中的台語字型議題

今年國慶日典禮中,蔡英文總統的演說末段引用了謝銘祐 《路》 的歌詞「有路,咱沿路唱歌;無路,咱蹽溪過嶺」,除了特別在蔡總統的臉書粉絲專業貼文特別作圖之外,也受到穿臺文衫Tshīng Tâi Bûn Sann 的分享,於兩篇粉專貼文當中仔細一看,「蹽」字都出現了缺字的問題。
後續穿臺文杉貼文的缺字問題被貼上了 fb 字嗨社團討論,幾小時內便在社團內獲得數百個讚與二十幾則留言的討論,經過眾人的反應,該粉專已經以自行拆字組字的方式修正該圖。

圖片擷取自穿台文杉以及蔡英文粉絲專頁,穿台文杉以標楷體替代,蔡英文以思源宋體替代

台文現在面臨最大的問題其實就是缺字問題,也因為缺字而在 fb 字嗨社團中博得了些許關注目光。在九月底還有另一篇關於金萱的臺文缺字的貼文,該文的留言對台語漢字議題開啟了相當精彩的辯解與討論,後續該討論串也被管理員收錄成精華貼文,推薦大家有閒的話可以去翻翻。

漢字少數族群-台文

台語的書面文字起步的較晚,並不如華語有如此多的使用人口與商機。

以華語的發展來說,台灣教育部早在 1979 年與 1982 年即公布了常用國字標準字體表與次常用國字標準字體表,隨後被收錄進常用的電腦漢字字元集標準 Big5 以及萬國碼 Unicode 中,當今市面上的字型產品大多數都以此兩種編碼為主要的參考依據。
字型廠商為商業上的多數服務,為華語做字;一般人生活中所追求的漢字不缺字,追求的也都是「華語漢字的不缺字」。

相對的,台語的部分就沒那麼樂觀了,直到 1995年,教育部才開始委託學者進行「閩南語本字研究計畫」,而後才出版八本閩南語字彙,並頒布臺灣閩南語漢字之選用原則,2009 年頒布 700 推薦用字,直到 2011 年才架設教育部臺灣閩南語常用詞辭典

因為相關字表的認定與收錄整理相當晚才開始進行,社會關注度與使用度亦不高,因此台語的漢字需求並不受到字型廠商的關注,時常發生缺字情況。

擷取自教典

教典和 700 推薦用字當中的許多漢字其實並不在 Big5 編碼當中,Unicode 編碼則是直到今年三月頒布的 Unicode 13.0 文字擴充區 G 才給予教典的最後缺的漢字𰣻(⿸疒哥)與《咱來學閩南語:讀文章蓋趣味 01》《臺灣宗教百景名單》中出現的𰹬(⿰車藏)編碼,現在教典中所收錄的漢字終於都獲得自己的 Unicode 編碼了。但是,仍有許多俗寫字或異用字未有編碼,如本文前段所提及的台灣ê店的"ê"(⿱入下)。

關於教典中的非 Big5 編碼漢字,莊銘彥 2019 年發表的畢業專題《再會豆腐字》整理了本土語言外字表,很詳細地整理教育部本土語言相關出版品當中非 Big5 的漢字與羅馬字,提供了相當珍貴的資料來源。這個計畫開啟了台文使用族群與字型業者溝通的第一步,後續也促成了今年四月 jf 粉圓 1.1 更新以及源樣系列字型 1.5 更新

實際上,台文缺字根本每天照三餐發生,台文現實上就是漢字中的弱勢族群,當今任何的台文相關媒體中處處皆可發現缺字的蹤跡,若編輯者有相關意識的話,通常就會做出些委屈的折衷對應處理,如改用異用字、以拆分的部件表示、或以漢羅並行的方式行文,以下數張圖片擷取自公視台語台兩個不同節目中的缺字現場,以及《我咧唱歌》電子書上市時的社群討論截圖。

圖片擷取自上臺語曾偉旻胡妤萱兩部,顯示公視台語台上臺語當中將就於漢字缺字的相關處理
圖片節取自公視+全家有智慧
圖片擷取自台語社黃以丞貼文,顯示了我咧唱歌電子書版本所出現的缺字問題

羅馬字的支援狀況

如果用漢字書寫台語會照三餐缺字,是不是全改用羅馬字書寫就沒問題了呢?

並沒有,我用一句話的自我介紹測試給你看。

(POJ)Ta̍k-ke hó góa-sī Tân Kàn-tiong, góa siōng ài chia̍h hiuⁿ-ko͘ ^^.

(TL)Ta̍k-ke hó guá-sī Tán Kiàn-tiong, guá siōng ài tsia̍h hiunn-koo ^^.

(漢)逐家好我是陳建中,我上愛食香菇^^。

(華)大家好我是陳建中,我最愛吃香菇^^。

下圖為兩種全羅寫出的自我介紹,套用 5 個 windows 系統內建基本字型思源黑體的結果,而以《再會豆腐字》所增補過的思源黑體的衍伸作豆腐烏作為對照組。

由上圖可以發現,其實沒有任何一套字型是完整的支援白話字與台羅的,新細明體、標楷體跟微軟正黑體在第七第八調調符、鼻音符號以及白話字 [ɔ] 韻母的右上點有缺字;Times New Roman 以及 Arial 乍看之下沒有缺字,但其實在白話字的 [ɔ] 韻母右上角點顯示位置過於右上,不太理想,與後面的笑臉都打在一起了,所以只適合書寫台羅;思源黑體也不支援第八調以及鼻音符號和白話字 [ɔ] 韻母;豆腐烏則有特別針對台語羅馬字需求做過調教,顯示的效果才正確。

左圖整理台語所使用的附加符號的範例,右圖則擷取自《再會豆腐字》

羅馬字的地位比起漢字又更加卑微,漢字缺字現在還算挺常被大家所關切與討論,社會大眾較為敏感,而羅馬字的缺字卻鮮少被認知與討論,畢竟台語羅馬字的教育並非那麼普及。

許多編輯者與使用者在使用時,也並沒有意識到應該挑選有針對台語羅馬字設計過的字型來使用,導致顯示不良的台語羅馬字在各種文宣與媒體上張牙舞爪。甚至出現在教學圖文或博士論文當中,根本是無孔不入。

綜藝節目的羅馬字缺字
博士論文的羅馬字缺字
教學現場的羅馬字缺字

段落小結

由以上內容可以得知,現今台語的字型需求常常是被忽視的,台文的使用者通常也缺乏選用字型的相關意識,導致缺字問題叢生。相關的議題仍有待推廣與傳播。

關於台語的字型發展,請繼續閱讀下篇
台語文字的字型發展現況(下)-台文書寫字型選用推薦與比較

--

--