字體為什麼會缺字?
使用字體碰到缺字的原因有很多,最主要原因是字體使用的字集,其次與輸入法有關。
繁體中文在開發時最常使用的字體規格為Big5-2003(大五碼),共收錄13,060個漢字。有1萬多漢字怎麼還會缺字?原因是有些一般生活常用字並沒有收錄在其中,像是塵蟎的「蟎」、擀麵的「擀」等文字。因此形成使用Big5字集開發的字體在編排文件出現缺字的情形。
為了降低使用者用字缺字的機率,文鼎字型以現有Big5-2003字集規格為基礎,參考教育部字頻總表、中研院現代漢語語料庫詞頻統計、網路流行用字以及行銷與客戶服務所累積的資訊,彙整389個漢字,整合成Big5_AR 2021規格,自2021年以後皆以此規格進行新字體產品的開發,早期熱銷、經典的字體亦規劃補字更新,使用者可以透過iFontCloud獲得最新版本的字體使用。(完整的介紹請參考:消除繁體中文缺字的困擾)
再來談到輸入法。
可以打出漢字的中文輸入法有很多種,每種輸入法形成漢字的方式不大相同,一般常見為注音輸入法和漢語拼音輸入法。
如果不是使用注音輸入法或漢語拼音輸入法,有些字符的漢字與部首外型長得一樣,但是實際上分屬於不同的Unicode碼位,就會形成透過輸入法顯示出來的文字誤植成部首字也渾然不知,誤以為是字體缺字。以字符「日」為例,「日」漢字的Unicode碼位是U+65E5,是定義在中日韓統一表意文字(CJK Unified Ideographs)中,另外有一個與其形狀幾乎一樣的「日」,是位於康熙部首字區(Kangxi Radicals)的部首字,它的Unicode碼為是U+2F47,U+2F47其為Unicode於 Unicode 3.0 根據康熙字典的214 個部首按序編排,位於 U+2F00 - U+2FD5當中的一個字元。此區段的字符是用於表示部首使用,不是中日韓統一表意文字區段內的漢字,而繁體中文使用的Big5-2003的規格並沒有完整收錄這些部首字的字符,在這樣的情況下,如果使用標準Big5-2003字集的字體,在輸入U+65E5國字的「日」能夠顯示套用的字體,但是打成U+2F47部首字的「日」則可能會顯示缺字的狀況。
下次碰到字體缺字的狀況別驚慌,先確認字符是否為漢字以及字體使用的字集就能解決大部分的問題囉!