字体为什么会缺字?
使用字体碰到缺字的原因有很多,最主要原因是字体使用的字集,其次与输入法有关。
繁体中文在开发时最常使用的字体规格为Big5-2003(大五码),共收录13,060个汉字。 有1万多汉字怎么还会缺字? 原因是有些一般生活常用字并没有收录在其中,像是尘螨的「螨」、擀面的「擀」等文字。 因此形成使用Big5字集开发的字体在编排文件出现缺字的情形。
为了降低用户用字缺字的机率,文鼎字型以现有Big5-2003字集规格为基础,参考教育部字频总表、中研院现代汉语语料库词频统计、网络流行用字以及营销与客户服务所累积的信息,汇整389个汉字,整合成Big5_AR 2021规格,自2021年以后皆以此规格进行新字体产品的开发,早期热销、经典的字体亦规划补字更新,用户可以透过iFontCloud获得最新版本的字体使用。 (完整的介绍请参考:消除繁体中文缺字的困扰)
再来谈到输入法。
可以打出汉字的中文输入法有很多种,每种输入法形成汉字的方式不大相同,一般常见为注音输入法和汉语拼音输入法。
如果不是使用注音输入法或汉语拼音输入法,有些字符的汉字与部首外型长得一样,但是实际上分属于不同的Unicode码位,就会形成透过输入法显示出来的文字误植成部首字也浑然不知, 误以为是字体缺字。 以字符「日」为例,「日」汉字的Unicode码位是U+65E5,是定义在中日韩统一表意文字(CJK Unified Ideographs)中,另外有一个与其形状几乎一样的「日」,是位于康熙部首字区( Kangxi Radicals)的部首字,它的Unicode码为是U+2F47,U+2F47其为Unicode于Unicode 3.0根据康熙字典的214个部首按序编排,位于U+2F00 - U+2FD5当中的一个字符。 此区段的字符是用于表示部首使用,不是中日韩统一表意文字区段内的汉字,而繁体中文使用的Big5-2003的规格并没有完整收录这些部首字的字符,在这样的情况下,如果使用标准Big5-2003字集的字体, 在输入U+65E5国字的「日」能够显示套用的字体,但是打成U+2F47部首字的「日」则可能会显示缺字的状况。
下次碰到字体缺字的状况别惊慌,先确认字符是否为汉字以及字体使用的字集就能解决大部分的问题啰!