因編碼造成缺漏字的解決方法_造字碼位

2021-08-10 09:55:48.0

分類: Font Technology

在前一篇文章「字符集:Big5與Unicode的差異」提到,我們在個人電腦上無法打出想要的字元或無法正確顯示字元,大多是因為使用的字型所支援的字符集涵蓋範圍的多寡而造成的缺字情況,這是設計師或一般使用者會遇到的缺字原因;還有一種是在公家機關或是企業的資訊系統中會遇到的缺字情況_因字型編碼相容的問題所造成的缺字。

很多公司企業財會單位使用的報表系統還是封閉型的系統環境,追求的是系統的安全性、正確性與穩定性,每一次系統的更新就需要一筆龐大的費用,因此,若無重大使用上的問題,在預算考量上往往會選擇沿用現有系統,而不耗費預算升級到新系統。在這樣的情況下,使用單位/公司有可能會因為報表系統比較老舊,只能支援Big5字集,以至於開發的系統軟體無法使用Unicode字集字型顯示,造成列印、輸出漏字或亂碼的情況,此時就會需要透過Big5造字碼位來進行造字。

什麼是造字碼位,由於現在的Windows系統內碼是使用Unicode編碼,但如果我們使用的應用軟體無法直接支援Unicode編碼,就必須要將Unicode資料轉換成Big5編碼的資料,在Big5編碼的碼區裡有定義四個區域可以用來存放使用者造字,我們可以把Big5字集不包含的Unicode編碼的字,依照我們的需求將其存放在這四個造字區內。如此一來,就可以像古代倉頡造字那樣,為自己的資訊系統環境添加一些造字,解決在Big5編碼範圍內,電腦環境中無法正確顯示Unicode編碼的字之困擾。

 

不過,因為每個機關所使用到造字的時機與難字不全然相同,所以同樣的造字碼位所存放的難字在A機關與B機關通常是不一樣,因此使用造字碼位所存放的資料是無法直接互相交換,需要透過另一個CNS11643資訊交換碼來串接交換,讓資訊在交換的過程中不會缺漏。

 

造字碼位範圍

可造字數

FA40-FEFE

785

8E40-A0FE

2041

8140-8DFE

2983

C6A1-C8FE

408

總計

6217

 

 

 

 

 

微軟雖有提供造字編輯程式,可以供使用者使用,以編輯點陣圖的方式造字,雖然介面較為簡易上手,但需要以畫格子的方式逐一將字元圖像點畫出來,在美感上不是那麼好看也較費時。

文鼎了解機關企業的造字需求,開發了更為便利的造字管理系統,以解決造字編輯美觀、便利性的問題,如此一來,就可以輕鬆解決缺字的問題。資訊交換的問題,文鼎也可以協助您。


Font Technology

精巧字數的繁體中文規格 Arphic Big-5 Miniset

在台灣,從使用的角度來看,我們長期觀察做為標題使用的display type後,總結出標題用的display type,使用到Big-5字集所有字的機會不大這樣的結論。

業界在進行繁體中文字體開發時,大多是以Big-5這個規格為標準,當中定義了多達一萬三千多個漢字及六百多個符號字元,因此,每一套新字的推出,都面臨開發期程太長、成本太高的挑戰。以此,在進行字體開發時,是不是可以只需要設計比較常用到的字、剔除較罕用的字,來縮小Big-5字集的規模呢?這樣的好處是可以用較快的時間、較少的成本來,快速的滿足市場上大部分的應用需求,因此文鼎字型訂立Big-5_Miniset這個文鼎自定義產品規格。

下圖是文鼎DC曼蒂手書體由插畫家曼蒂書寫的次常用字區數位字稿,文鼎字型與外部的書法家、設計師合作開發DC系列產品時,常常收到的回饋是:怎麼要寫那麼多字啊!這些字我都沒有看過噎!真的有人用到這些字嗎!確實,除了前述降低產品開發的成本考量外,不要為難設計師、浪費設計師的時間,回歸到讓設計師專注在常用字上,以相對較快、較高的品質設計出新的字型產品是文鼎字型訂立Big-5_Miniset的初衷。

繁體中文Big-5_Miniset這個規格收錄了7,374個中文漢字,當中包含了常用國字標準字體表、字頻總表等生活中常見的字、詞、詞頻,由此構成Big-5_Miniset這個精選字數。從產品名稱上如何辨識Big-5 Miniset規格的字體呢?以文鼎新上架的文鼎濃湯體為例,文鼎濃湯體是一款帶有濃厚寬度厚實感、滑順粗細交錯線條的產品,定位在display type標題字上的使用,從下圖來看,使用Big-5 Miniset規格開發的產品,在字體名稱會加入「Min」這個代碼做表示來與標準的Big-5字集規格的產品做區隔。

雖然是以精選小字集7,374個漢字的規格來開發產品,但在完整字體的開發策略上,仍保有擴充到完整Big-5的規劃與機制,文鼎濃湯體是文鼎字型第一款以Big-5_Miniset規格釋出的產品,歡迎設計師們在使用後給我們回饋與指教,如果想要了解Big-5_Miniset包含了哪些中文漢字,請點選下方圖像連結下載文鼎Big-5_Miniset字碼本。

Font Technology

由5W3H帶你近一步洞悉WEBFONT的好

什麼是WebFont?!

從字面上解釋,WebFont中文意思是網頁字型,即以網頁為載體,讓各種風格的字型透過排印呈現出來。在網頁上一般的閱讀文字多使用系統預設字體,標題、圖形上若需要使用的文字,大多讓文字以圖形的方式呈現,而WebFont網頁字型它是一種以真實文字方式呈現在各種平台瀏覽器上的技術。您可以為網站的內容或圖形上的文字選擇適合風格的字型,讓瀏覽網頁的使用者看見不一樣的效果,可以讓字型即時套用您的網頁上,讓網頁不在只有單調古板的預設字體。

 

為什麼要裝WebFont

早期網頁技術如果要用電腦預設字以外的字型做網頁,必須要將其轉換成圖檔,區塊性的丟在頁面上顯示,但如果文案需一改再改就必須對圖檔做修改,所耗費的時間成本相對的多,而這樣的網頁勢必要對圖片解析度有著相對高的要求,當然,一個網站如果高解析度的圖檔過多,可想而知,如果網站運行不想成為慢郎中,運作所需要的效能相對的要求更高,所付出的成本相對的也會跟著提高。

 

WebFont的是一種能夠在網頁上即時套用字型的技術,能夠解決網頁設計師對於內容修改上耗費多工的情況,也不用擔心效能上的需求問題,操作方式簡單易懂,只需幾個步驟,即可為您的網頁換上新的風貌。文鼎iFontCloud提供網頁字型技術的服務,讓網頁設計師能夠以合法、正確的方式,將iFontCloud網站上眾多風格眾多的字型放在網頁上。

 

以下以文鼎WebFont網頁字型為例,透過兩種方法簡單設定網頁字型,設定後即可用嵌入JS語法,呼叫Web FontJavaScript連結嵌入網站,完成WebFont套用,詳情可參考 教學文件

1. iFontCloud Web Font設定頁面挑選字型後自動設定

2. Web Font字型名稱寫在網站設定檔中(font-family)

 

WebFont就是一種以最實惠的價格,讓網頁效能極大化的服務,您還在等什麼呢?請參考網頁字型

Font Technology

消除繁體中文缺字的困擾

流行音樂創作歌手陶喆,常看到他的名字是用「陶吉吉」的方式顯示,而非直接寫出「喆」,為什麼有一些字型「喆」呈現不出來?必須用兩個吉來表示呢? 

繁體中文最常使用的字體規格為Big5-2003(大五碼),共收錄13,060個漢字。但是,身處數位時代的使用者,文字的使用大多透過輸入法的方式呈現在軟體上,有時候有可能是因為使用者輸入文字時,選字錯誤,積非成是,有時候也有可能是當下標新立異,選型不選字,取「意」不取「義」,透過輸入法輸入、貼文複製,而用到非Big5字集的字元,而造成缺字的情形。

為了降低使用者用字缺字的機率,文鼎字型以現有Big5-2003字集為基礎,參考教育部字頻總表、中研院現代漢語語料庫詞頻統計、網路流行用字以及行銷與客戶服務所累積的資訊,彙整389個漢字,整合成Big5_AR 2021規格。新增收錄於Big5_AR 2021規格的字元,包含塵蟎的「蟎」、擀麵的「擀」、尊稱神明的「祢」、峰的異體字「峯」以及双、堃、宝、峯、崐、彣、喆、雫、邨……。



文鼎字型已著手規劃,挑選經典、熱銷的字型產品逐步更新為Big5_AR 2021規格,目前已經更新至此規格的字型產品有:文鼎書苑宋體、文鼎書苑黑體、文鼎簽字筆體、文鼎DC蔡燊軒行書體; iFontCloud文鼎雲字庫字體租賃服務的客戶,已下載啟用這些字型的使用者,在租賃期間,字檔會透過字庫管理工具自動地做檔案更新,若您是第一次下載啟用,則會直接取得最新字型檔案。未來,文鼎字型所開發的新產品,也會依此規格做產品化。