消除繁体中文缺字的困扰

2022-03-15 09:32:07.0

分類: 字体技术

流行音乐创作歌手陶喆,常看到他的名字是用「陶吉吉」的方式显示,而非直接写出「喆」,为什么有一些字型「喆」呈现不出来?必须用两个吉来表示呢? 

繁体中文最常使用的字体规格为Big5-2003(大五码),共收录13,060个汉字。但是,身处数字时代的用户,文字的使用大多透过输入法的方式呈现在软件上,有时候有可能是因为用户输入文字时,选字错误,积非成是,有时候也有可能是当下标新立异,选型不选字,取「意」不取「义」,透过输入法输入、贴文复制,而用到非Big5字集的字符,而造成缺字的情形。

为了降低使用者用字缺字的机率,文鼎字型以现有Big5-2003字集为基础,参考教育部字频总表、中研院现代汉语语料库词频统计、网络流行用字以及营销与客户服务所累积的信息,汇整389个汉字,整合成Big5_AR 2021规格。新增收录于Big5_AR 2021规格的字符,包含尘螨的「螨」、擀面的「擀」、尊称神明的「祢」、峰的异体字「峯」以及双、堃、宝、峯、昆、彣、喆、雫、邨……。



文鼎字型已着手规划,挑选经典、热销的字型产品逐步更新为Big5_AR 2021规格,目前已经更新至此规格的字型产品有:文鼎书苑宋体、文鼎书苑黑体、文鼎签字笔体、文鼎DC蔡燊轩行书体; iFontCloud文鼎云字库字体租赁服务的客户,已下载启用这些字型的用户,在租赁期间,字档会透过字库管理工具自动地做档案更新,若您是第一次下载启用,则会直接取得最新字型档案。未来,文鼎字型所开发的新产品,也会依此规格做产品化。


Font Technology

因編碼造成缺漏字的解決方法_造字碼位

在前一篇文章「字符集:Big5與Unicode的差異」提到,我們在個人電腦上無法打出想要的字元或無法正確顯示字元,大多是因為使用的字型所支援的字符集涵蓋範圍的多寡而造成的缺字情況,這是設計師或一般使用者會遇到的缺字原因;還有一種是在公家機關或是企業的資訊系統中會遇到的缺字情況_因字型編碼相容的問題所造成的缺字。

很多公司企業財會單位使用的報表系統還是封閉型的系統環境,追求的是系統的安全性、正確性與穩定性,每一次系統的更新就需要一筆龐大的費用,因此,若無重大使用上的問題,在預算考量上往往會選擇沿用現有系統,而不耗費預算升級到新系統。在這樣的情況下,使用單位/公司有可能會因為報表系統比較老舊,只能支援Big5字集,以至於開發的系統軟體無法使用Unicode字集字型顯示,造成列印、輸出漏字或亂碼的情況,此時就會需要透過Big5造字碼位來進行造字。

什麼是造字碼位,由於現在的Windows系統內碼是使用Unicode編碼,但如果我們使用的應用軟體無法直接支援Unicode編碼,就必須要將Unicode資料轉換成Big5編碼的資料,在Big5編碼的碼區裡有定義四個區域可以用來存放使用者造字,我們可以把Big5字集不包含的Unicode編碼的字,依照我們的需求將其存放在這四個造字區內。如此一來,就可以像古代倉頡造字那樣,為自己的資訊系統環境添加一些造字,解決在Big5編碼範圍內,電腦環境中無法正確顯示Unicode編碼的字之困擾。

 

不過,因為每個機關所使用到造字的時機與難字不全然相同,所以同樣的造字碼位所存放的難字在A機關與B機關通常是不一樣,因此使用造字碼位所存放的資料是無法直接互相交換,需要透過另一個CNS11643資訊交換碼來串接交換,讓資訊在交換的過程中不會缺漏。

 

造字碼位範圍

可造字數

FA40-FEFE

785

8E40-A0FE

2041

8140-8DFE

2983

C6A1-C8FE

408

總計

6217

 

 

 

 

 

微軟雖有提供造字編輯程式,可以供使用者使用,以編輯點陣圖的方式造字,雖然介面較為簡易上手,但需要以畫格子的方式逐一將字元圖像點畫出來,在美感上不是那麼好看也較費時。

文鼎了解機關企業的造字需求,開發了更為便利的造字管理系統,以解決造字編輯美觀、便利性的問題,如此一來,就可以輕鬆解決缺字的問題。資訊交換的問題,文鼎也可以協助您。

Font Technology

GB18030中文編碼字符集

GB18030是中國大陸規範的的漢字編碼字符集標準,GB 18030-2005共收錄漢字70,244個。

目前GB18030有GB18030-2000 及GB18030-2005兩個版本,2000年發佈的GB18030-2000,全名是《信息技術 漢字編碼字符集 基本集的擴充》。GB18030-2000僅規定了常用非漢字符號和27,533個漢字(包括部首、部件等)的編碼,GB18030-2000是一個強制性的標準,市場上銷售的產品用字必須符合其規範。而2005年發佈的GB18030-2005在GB18030-2000的基礎上增加了42,711個漢字和多種中國少數民族文字的編碼,增加的這些內容是推薦性質,無強制規範。

簡要來說,目前若提到GB18030規格的產品,其對應的標準為GB18030-2005,其中27,533個漢字為基本必要的強制規範範圍。

 

什麼時候需要使用到GB18030字集的字體/ GB18030字集的使用範圍

由於GB18030字集的字元數多達兩萬多字,一般來說,在簡體中文的使用情境,基本的GB2312規格已經足夠使用,但在需要顯示中文姓氏、人名、地名等情況時,由於中文漢字的特性,在上述情況可會出現罕用字的使用,這時候就需要使用GB18030字集的字體來做排版,避免出現缺漏字的情況。

2005年11月發佈的GB 18030-2005版本中文編碼字符集,已要求各種電腦作業系統、字型產品、輸入法、應用軟體、及內建嵌入式系統的3C電子、通信設備,如Smart Phone、Tablet、印表機等周邊設備,要支援GB 18030字集。

 

 

中國大陸編碼標準的演進

1980年頒佈了第一個漢字編碼字元集標準,為GB 2312-80《資訊交換用漢字編碼字符集基本集》。此標準總共定義8,836個碼位,收納了6,763個漢字及682個常用符號,總共有7,445個字元。此規格在早期幾乎是唯一的標準,即使到目前為止,在中國大陸也是電腦系統、軟體及各種設備使用最廣泛的中文編碼標準。

1995年中國全國信息技術標準化技術委員會公佈了【漢字內碼擴展規範(GBK)】, GBK(K是"擴展"的漢語拼音第一個字母),總共定義23,940個碼位,收錄了21,003個漢字與884個符號共21,887個字元。

2000年國際標準組織ISO又公佈了ISO 10646-1:2000(Unicode 3.0),主要是增加中日韓統一漢字Extension A的6,582個字元。大陸的GBK規格已無法容納新增的字元,因此GB18030-2000編碼標準就在原來的 GB2312-1980 編碼標準和 GBK 編碼標準的基礎上進行擴充。

 

字型產品與GB 18030的關係

中國政府對中文字型,尤其是簡體中文字型,訂定有國家檢測認證的標準,尤其是最常使用的4種造型字型:宋、仿、楷、黑,要求使用字型於產品顯示的3C通信、資訊、電子等廠商,必須使用政府認證的字型。一般常用的點陣字型(Bitmap Font),如12x12、16x16、32x32、 …等等,都有強制性標準。也就是說要向大陸官方購買取得公司使用授權,再將字型載入嵌入式系統產品上,如手機,電子字典、印表機等,這些產品才能銷售到大陸。

大陸對於向量字型的規範,採取審查核准使用的方式,簡體中文字體的認證,由中國政府的信標委及CESI (中國電子技術標準化研究所)負責,中國政府為避免各家字型公司,所開發的簡體字型品質不一,由中國官方特別指定的認證單位,訂定規範、製作、授權標準,針對在大陸地區使用之簡體字型之完整性、正確性、規範性、風格一致性、結構合理性等進行審核。因此,在中國所有使用於3C通信、資訊、電子等產品上之簡體中文字型,都必需是取得CESI認證的字型。因此對於採用TTF等向量字型的裝置設備,例如智慧手機、平板電腦、DTV/STB…等,就可以使用向量字型來取代需官方授權的點陣字型。

目前為止,文鼎已有11套字型取得CESI認證規範,分別是五套GB18030字集,六套GB2312字集,字型清單如下:

項次

字集

文鼎中文字型

1

GB18030

文鼎報宋二

2

文鼎中楷

3

文鼎晶栩楷體

4

文鼎晶栩黑體

5

文鼎UD晶熙黑體

6

GB2312

文鼎UD晶熙黑體

7

文鼎粗黑

8

文鼎書林黑_L

9

文鼎書林黑_M

10

文鼎Mobile中黑

11

文鼎书苑黑体B

 

總結

在中國市場銷售3C電子、通信產品的國內外廠商,都已了解要進入中國市場,無論是軟體產品或硬體產品,必須採用中國政府標準規範的GB18030中文編碼字符集,及使用中國政府認證的中文字型產品才能順利做銷售。文鼎字型可以提供認證的GB18030字型,授權給3C電子、通信廠商,做產品設計、製造及銷售,將字型內嵌於產品中,廠商不但不用擔心符合規範的問題,又可以取得功能上與成本上無可取代的優勢。

 

 
 
 
 
 
 
 
 

 

 

Font Technology

由5W3H帶你近一步洞悉WEBFONT的好

什麼是WebFont?!

從字面上解釋,WebFont中文意思是網頁字型,即以網頁為載體,讓各種風格的字型透過排印呈現出來。在網頁上一般的閱讀文字多使用系統預設字體,標題、圖形上若需要使用的文字,大多讓文字以圖形的方式呈現,而WebFont網頁字型它是一種以真實文字方式呈現在各種平台瀏覽器上的技術。您可以為網站的內容或圖形上的文字選擇適合風格的字型,讓瀏覽網頁的使用者看見不一樣的效果,可以讓字型即時套用您的網頁上,讓網頁不在只有單調古板的預設字體。

 

為什麼要裝WebFont

早期網頁技術如果要用電腦預設字以外的字型做網頁,必須要將其轉換成圖檔,區塊性的丟在頁面上顯示,但如果文案需一改再改就必須對圖檔做修改,所耗費的時間成本相對的多,而這樣的網頁勢必要對圖片解析度有著相對高的要求,當然,一個網站如果高解析度的圖檔過多,可想而知,如果網站運行不想成為慢郎中,運作所需要的效能相對的要求更高,所付出的成本相對的也會跟著提高。

 

WebFont的是一種能夠在網頁上即時套用字型的技術,能夠解決網頁設計師對於內容修改上耗費多工的情況,也不用擔心效能上的需求問題,操作方式簡單易懂,只需幾個步驟,即可為您的網頁換上新的風貌。文鼎iFontCloud提供網頁字型技術的服務,讓網頁設計師能夠以合法、正確的方式,將iFontCloud網站上眾多風格眾多的字型放在網頁上。

 

以下以文鼎WebFont網頁字型為例,透過兩種方法簡單設定網頁字型,設定後即可用嵌入JS語法,呼叫Web FontJavaScript連結嵌入網站,完成WebFont套用,詳情可參考 教學文件

1. iFontCloud Web Font設定頁面挑選字型後自動設定

2. Web Font字型名稱寫在網站設定檔中(font-family)

 

WebFont就是一種以最實惠的價格,讓網頁效能極大化的服務,您還在等什麼呢?請參考網頁字型