前两天,中华人民共和国香港特别行政区政府与中文界面咨询委员会合编的《香港增补字符集》发布了最新版本 ——《香港字符增补集—2016》,包含 5033 个在香港通用的字符,将有助香港市⺠和政府部门以中文进行电子通讯和资料交换,也标志着汉字标准化的进一步推进。

这里需要强调的是,《香港增补字符集 》只是编码字符集,而非香港字形标准 ,后者可参见《香港电脑汉字楷体字形参考指引》和《香港电脑汉字宋体(印刷体)字形参考指引》。

《香港增补字符集》?

半个月前,我翻译了小林剑博士的文章 《思源黑体 vs 思源宋体》。其中在“对区域标准的覆盖”部分提及了,思源黑体与思源宋体仅有限支持香港增补字符集(前者只是码位支持,后者仅包含极少字形)。小林剑的解释是香港增补字符集—2008 存在各种问题,因此将在思源宋体 2.000 版 中支持有香港增补字符集—2016 支持的香港字形。因此这次的发布也意味着针对香港地区的中文字体厂商有着更佳的参考标准,无疑推动香港公共空间的设计环境。

从前,香港市民在使用电子设备时,可能无法使用或交换一些在香港较常使用的字符,例如人名、地方名和粵方言用字等。

 

它收录了哪些字符?

最新的《香港增补字符集−2016》共收录 5033 个字符,其中 4601 个汉字,占 91%,覆盖了香港政府部门,如律政司、税务局、司法机构、地政总署、香港警务处、入境事务处 、公司注册处等,学术组织、教育机构,以及一般市⺠建议收录的专有名词用字,如人名、地名、公司名称,粤方言用字,科学名词用字,以及部首或部件等。其他 442 个字符包括汉字部件、汉语拼音字母、国际音标符号、日本平假名和片假名等各类符号。

(图为香港政府资讯科技总监办公室制作的《香港增补字符集》普通版故事介绍)

 

大中华地区对“电脑汉字”制定字符标准最早的是中国台湾,还记得小时候在电脑里摆弄输入法,总会对 Big-5 这个选项感到好奇。

由于众所周知的各种原因,台湾政府内部耽于内斗,在字符编码上出台过 CCCⅡ中文资讯交换码,以及 CNS 11643 通用汉字标准交换码”,即“中文标准交换码”;而商业标准更为繁杂,IBM 5550、倚天码、王安码,极为混乱。

于此情形下,“大五码”应运而生——台湾财团法人信息产业策进会为五大中文套装软件所设计的中文共通内码,并于 1984 年 3 月同 13 家厂商签定“16 位个人电脑套装软件合作开发(BIG-5)项目(五大中文套装软件)”,“大五码”因此得名。

虽然这一标准并非政府标准,而是行业对市场需求自发制定的规范,但因其解决了长期专有名词等字符的电脑编码需求,故而受到广泛使用,甚至影响到大陆。后来在 Big5-2003 中作为 CNS 11643 的一部分,发展为官方标准。一直以来大五码在繁体中文社区有很大的影响力。

香港增补字符集发展简史

而正如上面的漫画所描述的情况,香港因为各种原因,广泛且频繁地使用一些其他地区并未使用的汉字。

虽然大五码在一定程度上解决了繁体中文地域对字符编码的需求,但其在制定之初就存在诸多问题。

因为编制仓促,竟直接收录了《常用国字标准字体表》和《次常用国字标准字体表》 1,又因当时的政治环境,故忽略对台湾话用字的收录。更有甚着出现了和中国大陆简化汉字一样的合并部分汉字的情况。这些情形转移至香港造成了同样的结果,大量香港话用字未被收录,也就是开头介绍以及漫画展现的状况。

与台湾不同,香港政府办事效率高到不知到哪里去了。

1995 年,香港政府在 Big-5 的基础上作出修订扩充,发布了《政府通用字库》,也就是《香港增补字符集》的前身。其发布之初仅供政府内部使用,后来为方便市⺠阅读政府发布的电子化资料,就公开在网站上供民众下载使用。

1998 年,前资讯科技署与前法定语文事务署合作修订《政府通用字库》,向各界收集本地特有的中文字符。

1999 年,香港政府与中文界面咨询委员会合作完成了《政府通用字库》的修订工作,并改名为《香港增补字符集》,同年九月公布。方便起见也称《香港增补字符集—1999》,共收录 4702 个字符,有一套适用 ISO/IEC 10646 国际编码标准平台的方案,和一套适用大五码的方案。

2000 年 4 月,香港政府与中咨会公布《香港增补字符集》的字符增收程序和原则,定期举行会议,审核申请,过审字符提交国际标准化组织(ISO)下辖的表意文字小组(IRG),以备纳入 ISO/IEC 10646 中。

2001 年 12 月,香港政府公布《香港增补字符集−2001》,新增了 116 个中文字,并在技术上配合国际标准化组织于 2001 年 11 月公布的 ISO/IEC 10646-2:2001。

2005 年 5 月,香港政府公布《香港增补字符集−2004》,新增 123 个字符,字符总数达 4941 个。技术上配合 ISO/IEC 10646:2003 及其第一修订版,ISO/IEC 10646:2003 及其修订版也收纳了《香港增补字符集−2004》的全部字符。

2008 年 3 月 31 日起,《香港增补字符集》更改了增收字符原则——此后增收的字符不再获配大五码的码位,但不影响之前收录的码位。这一决定是基于香港政府“数码 21”科技政策作出的,而这一政策就是采用 ISO/IEC 10646 和《香港增补字符集》。

2009 年 12 月,为增收字符原则的修订以及 ISO/I EC 10646:2003 第 6 修订版,香港政府公布了《香港增补字符集−2008》,新增 68 个字符,配合 ISO/IEC 10646:2003 第一及第六修订版,ISO/IEC 10646:2003 及其第一至第六修订版也收纳了《香港增补字符集−2008》全部的字符。自此,《香港增补字符集》与 ISO/IEC 10646 完全接轨,其增收字符原则再次修订——过审字符在直接递交 ISO,ISO 过审后才可以加入《香港增补字符集》,另外除非获得 ISO 码位,否则不提供私人使用区编码。

2017 年 5 月,也就是前几日,香港政府公布《香港增补字符集—2016》,新增 24 个字符,取代《香港增补字符集—2008》,配合 ISO/IEC 10646:2014 第二修订版。

ISO/IEC 10646 是什么?

上面介绍《香港增补字符集》,自 1999 年第一版起就一直配合国际标准化组织制定的 ISO/IEC 10646,该标准覆盖范围远超任何一个中文标准,其目的是制定覆盖世界上所有主要语言的编码字符集,目的是解决因区域标准混乱的造成的交流阻塞的问题。

咁點解仲需要《香港增補字符集》?

国际标准的制定和和完善需要各国际或地区、企业甚至个人的参与。虽然 ISO 标准覆盖的汉字超过八万,但实际使用并无全部需要。比如一家中国大陆的公司,业务范围不超过大陆,那么完全没必要购买一款支持两岸三地甚至日本韩国的超大型字体,字体公司也没有必要耗费极大的精力开发这种变态字体(虽然思源字体家族支持广泛,但依然没有达到这么高的覆盖度,况且字体质量并不高)。所以《香港增补字符集》的出台为开发针对香港地区的字体提供了字符编码基础。

国内方正汉仪等字体公司的字体产品从未支持过香港字形

 

2016 版有什么更新?

码位变更

根据 ISO/IEC JTC1/SC2 标准制订工作组决议,对《香港增补字符集—2008》中两个字符的 ISO/IEC 10646 码位作出变更,其中 9FD0 已被纳入去年公布的 ISO/IEC 10646:2014。之前的码位作为兼容码位可在为采用新版 ISO/IEC 10646 的系统中使用。

仅提供 ISO/IEC 10646 码位

《香港增补字符集—2008》字符表码位说明

 

 

《香港增补字符集—2016》字符表码位说明
上面的字符表码位说明图中出现“Tofu”情况,使用思源宋体后方知是“碼位”(本网站 web font 使用思源宋体简体中文),该文档使用了如下字体:

我没有去查证,找到原因的朋友可以在下方回复。

字符增加

相比《香港增补字符集—2008》增收已被纳入 ISO/IEC 10646 的 23 个汉字(中日韩表意文字基本区)和 1 个符号(货币符号区)。

新增收字符表

表中 1 至 22 号为在《香港电脑汉字参考字形》中与大五码不同的字形,故予增收。因“鮟鱇”为香港常用词汇,而“鮟”早已收入《香港增补字符集—1999》,故增收 23 号。欧元符号为香港广泛使用货币符号,故增收 24 号。

支持《香港增补字符集》的字体

官方参考字体

根据官方指导,Linux 用户可以下载《香港增补字符集-2001》的 参考字体

华康标准宋体

华康香港开发的 华康标准宋体 ,对应《香港增补字符集-2001》

自由香港字型

该项目目前仅出品 自由香港楷书 (Free HK Kai),其根据香港特别行区教育局课程发展处中国语文教育组于 2012 年所编制出版的《常用字字形表(2007 年重排本)》为楷书字型基础作出修改,共有 4762 个小学生常用字,字型修改来源于台湾全字库正楷体。

昭源甄黑体

从思源黑体修改而成,适用于香港地区的中文字体。 这一字体 严格来说不能算支持《香港增补字符集》,其只是在思源黑体的基础上修订字形,一种方法通过更改映射,以其他符合香港字形的区域字形替代,另一种方法修改香港仅有的字形。其另对部分符号、数字等字符也作出了修改。

虽然随着《香港增补字符集—2016》的发布,以及香港字形规范的完善,思源字体家族也会在不久的将来发布支持香港字形的版本。但这并不意味着昭源甄黑体失去必要,按照开发者的初衷,这款字体平衡“标准书体”和“日常习惯”的意图满足部分用户需要。

你也可以参加这个项目

如果你是一个香港人,或者想为这个计划奉献一份力量,则可以在参阅 申请及原则 后,依照程序向香港中文界面咨询委员会提出增收字符的申请。

 


 

(译)注:

  1. 关于台湾《常用国字标准字体表》和《次常用国字标准字体表》,可参阅《國字標準字體宋體母稿》中的 “常用字索引”和“次常用字索引”

  1. 自由香港字型並不支持香港增補字符集,增補字符集有的字符,它有泰半都顯示不到。再者,這只是某幾個社工和掌握了香港開源活動財政撥款的人士,利用了一些字形發燒友的熱誠後,就把字形發燒友用陰險手段趕出局,以求自己去領獎的項目而已。

    1. 「這個伺服器無法證明所在網域是 freehkfonts.opensource.hk;伺服器的安全性憑證已在 21 天前過期。」

发表评论

电子邮件地址不会被公开。 必填项已用*标注