字体产品与应用 2024-05-16

字体为什么会缺字?

使用字体碰到缺字的原因有很多,最主要原因是字体使用的字集,其次与输入法有关。

繁体中文在开发时最常使用的字体规格为Big5-2003(大五码),共收录13,060个汉字。 有1万多汉字怎么还会缺字? 原因是有些一般生活常用字并没有收录在其中,像是尘螨的「螨」、擀面的「擀」等文字。 因此形成使用Big5字集开发的字体在编排文件出现缺字的情形。 

为了降低用户用字缺字的机率,文鼎字型以现有Big5-2003字集规格为基础,参考教育部字频总表、中研院现代汉语语料库词频统计、网络流行用字以及营销与客户服务所累积的信息,汇整389个汉字,整合成Big5_AR 2021规格,自2021年以后皆以此规格进行新字体产品的开发,早期热销、经典的字体亦规划补字更新,用户可以透过iFontCloud获得最新版本的字体使用。 (完整的介绍请参考:消除繁体中文缺字的困扰

再来谈到输入法。
可以打出汉字的中文输入法有很多种,每种输入法形成汉字的方式不大相同,一般常见为注音输入法和汉语拼音输入法。



如果不是使用注音输入法或汉语拼音输入法,有些字符的汉字与部首外型长得一样,但是实际上分属于不同的Unicode码位,就会形成透过输入法显示出来的文字误植成部首字也浑然不知, 误以为是字体缺字。 以字符「日」为例,「日」汉字的Unicode码位是U+65E5,是定义在中日韩统一表意文字(CJK Unified Ideographs)中,另外有一个与其形状几乎一样的「日」,是位于康熙部首字区( Kangxi Radicals)的部首字,它的Unicode码为是U+2F47,U+2F47其为Unicode于Unicode 3.0根据康熙字典的214个部首按序编排,位于U+2F00 - U+2FD5当中的一个字符。 此区段的字符是用于表示部首使用,不是中日韩统一表意文字区段内的汉字,而繁体中文使用的Big5-2003的规格并没有完整收录这些部首字的字符,在这样的情况下,如果使用标准Big5-2003字集的字体, 在输入U+65E5国字的「日」能够显示套用的字体,但是打成U+2F47部首字的「日」则可能会显示缺字的状况。

下次碰到字体缺字的状况别惊慌,先确认字符是否为汉字以及字体使用的字集就能解决大部分的问题啰!

字体技术 2022-03-15

消除繁体中文缺字的困扰

流行音乐创作歌手陶喆,常看到他的名字是用「陶吉吉」的方式显示,而非直接写出「喆」,为什么有一些字型「喆」呈现不出来?必须用两个吉来表示呢? 

繁体中文最常使用的字体规格为Big5-2003(大五码),共收录13,060个汉字。但是,身处数字时代的用户,文字的使用大多透过输入法的方式呈现在软件上,有时候有可能是因为用户输入文字时,选字错误,积非成是,有时候也有可能是当下标新立异,选型不选字,取「意」不取「义」,透过输入法输入、贴文复制,而用到非Big5字集的字符,而造成缺字的情形。

为了降低使用者用字缺字的机率,文鼎字型以现有Big5-2003字集为基础,参考教育部字频总表、中研院现代汉语语料库词频统计、网络流行用字以及营销与客户服务所累积的信息,汇整389个汉字,整合成Big5_AR 2021规格。新增收录于Big5_AR 2021规格的字符,包含尘螨的「螨」、擀面的「擀」、尊称神明的「祢」、峰的异体字「峯」以及双、堃、宝、峯、昆、彣、喆、雫、邨……。



文鼎字型已着手规划,挑选经典、热销的字型产品逐步更新为Big5_AR 2021规格,目前已经更新至此规格的字型产品有:文鼎书苑宋体、文鼎书苑黑体、文鼎签字笔体、文鼎DC蔡燊轩行书体; iFontCloud文鼎云字库字体租赁服务的客户,已下载启用这些字型的用户,在租赁期间,字档会透过字库管理工具自动地做档案更新,若您是第一次下载启用,则会直接取得最新字型档案。未来,文鼎字型所开发的新产品,也会依此规格做产品化。

Load More ▼