原文:Source Han Sans vs Source Han Serif

作者:Dr. Ken Lunde (小林剣)

时间:2017 年 5 月 8 日

译按:本文除了介绍思源黑体和思源宋体的区别,另宣布发布思源宋体 1.001 版

注意⚠️ 本译文获得原作者授权,转载请注明来源

在几乎每一个机会,不论是通过这个博客还是通过公开演讲,我都已经非常明确表示,Adobe 品牌的 Source Han 1 字体家族与相对应的 Google 品牌的 Noto CJK 字体家族共享相同的字形。 2 这是简单是事实。但是,还是需要解释一下 思源黑体思源宋体 这两个字体在设计上有何不同。这就是这篇文章特别之处。

作为这些泛中日韩字体家族的项目架构师,我接手开发过程中使用的所有数据,并为每个释出做准备。 因此,我可以提供一些在别处找不到的有用的信息。

名称和字重

因为思源字体家族内的字体风格和设计不同,他们的名称也必须不同,包括 7 种字重。思源黑体的 Normal 字重对应的思源宋体则是 SemiBold。Google 方面有他们的字重命名特点。

有趣的事,可以预见,有些人在思源宋体的繁体中文名称本地化方面有些歪曲,他们或许更期待使用“思源明体”。其实以“宋”代“明”是有意为之。请注意,思源宋体是一款泛中日韩字体,繁体中文的范围仅限大五码 3。因此,如下一节将要讲到的,在尝试使用超过大五码范围的表意文字时,遵循简体中文惯例而非繁体中文的可能性相对较高。换句话说,在繁体中文名称里使用“宋”也算一种温和微妙的提醒。

对区域标准的覆盖

第一点,也是很重要的一点,思源字体家族在表意文字方面的覆盖范围,几乎达到了各区域标准的上限。特别是中国大陆的 GB 18030 4、中国台湾的大五码、日本的 JIS 标准 5,以及韩国的 KS X 1001 6 和 KS X 1002 7。思源黑体和思源宋体目前的区别在于,前者至少编码位置上支持香港增补字符集 8,而后者出于填补 URO 9 的目的,只包含少量的香港字形。

还有一点很重要,一旦试图使用超出特定区域标准范围的表意文字,可能无法保证其字形能否遵循该地区惯例。

Unicode 版本

思源黑体 大约是三年前发布的,正好在 Unicode 7.0 版 发布之后。我们悄悄加入了四个表意文字——U+9FCD 鿍,U+9FCE 鿎,,U+9FCF 鿏,U+9FD0 鿐,这四个文字当时预计被编入在下个版本的 Unicode 中,并且被视为足够稳定的支持。实际上在次年 6 月,它们与另外五个从 U+9FD1 到 U+9FD5 的表意文字 。被编入了 Unicode 8.0 版 中。

Unicode 目前的版本是 9.0,而 10.0 版 预计下个月发布。

思源宋体 在上个月发布,包含 Unicode 8.0 版的五个表意文字,以及添加到 9.0 版中,预计下个月将包含在 10.0 版中的几个字符。其中包含这包括与 Adobe-Japan1-6  10 中汉字相对应的 3 个 扩展-F 的表意文字。

思源宋体的附加字符字符支持方面,有 53 个:

U+03C2 (1.1)、U+2B95 (7.0)、U+312E (10.0)、U+312F (11.0?)、U+9FD1 至 U+9FD5 (8.0)、U+9FD6 至 U+9FEA (10.0)、U+1F12F (10.0)、U+1F19B 至 U+1F1AC (9.0)、U+1F23B (9.0)、U+2D544 (10.0)、U+2E278 (10.0),以及 U+2E6EA (10.0)。

U+312F 被认为有足够稳定支持,预计编入 Unicode 11.0 版。

当然,你可以预期这些增加的字符会在思源黑体 2.000 版中支持,不过我对包含香港字形 U+9FD2 深表怀疑。

Unicode 字形指示序列

思源黑体和思源宋体的 Unicode 字形指示序列 在 Format 14 ‘cmap’ 子表 11 中被指定,在两个重要的方面有所不同。

首先,思源宋体的简体中文字体和字体实例包含 9 个与 中日韩兼容表意文字对应的标准化字形指示。请阅读我的博客的 这篇文章 中的 Event #4 以了解相关背景知识。

其次,思源宋体包含 3 个 Adobe-Japan 1 IVSes(表意文字字形指示序列) 12,他们的基本字符在扩展-F 中,预计在 7 月被注册。详情请参阅 PRI #349

思源黑体 2.000 版将包含这些重要而强大的微调。虽然最新的简体中文字体和字体示例不包含 9 个标准化字形指示,但我向这个项目添加了 SourceHanSans_CN_sequences.txt Unicode 字形指示序列定义文件。

错误——已知的和新的

当开发包含大量字形的字体时,不可避免地存在出现错误的可能性。鉴于字符数量庞大,我会说我确信这两款字体的设计中都潜藏着错误。这是理所当然的。

幸运的是,像这些托管在 GitHub 上的开源项目,有着很好的报告和跟踪问题的机制。我对那些发现和报告问题的人表示感谢。一些错误报告可能被视为对字体设计的吹毛球次,这些问题取决与设计人员决定是否解决,以及如何解决。剩下的则是亟待解决的真正的错误。

底线是,如果某些东西看起来像一个错误,那么可能是,特别是当比较两个字体时,字形上有着明显不同。谨慎的做法是报告问题,然后让我或设计师做出决定。 同时要记住, 标准不是没有错误的

字形共享

字体的可跨语言共享的程度取决于两个主要因素:字体样式和字体设计。在本段的语境中,字体风格一般意义上最好描述为是否是衬线字体。字体设计是指使该字体与基于相同字体风格的其他字体设计区别开来的实际设计的细节。

不论字体设计如何,一些表意文字的字形往往超过一种,至少在设计黑体和宋体时。U+5973 女 就是一个很好的例子,展示了一个共享的日语/朝鲜语字形和单独的中国大陆和中国台湾字形:

以下图片示例说明了基于字体设计的字形共享的差异,因此与无衬线设计的 U+91D1 金,单独的日语/朝鲜语字形和中国大陆/中国台湾字形相比,衬线设计仅包括为所有语言提供的单个字形:

额外的日本字形

思源字体家族的初衷是包含大约 6000 个额外的日本字形,这超过了 JIS 和 Adobe-Japan1-6 中的标准。 在思源黑体中,这些额外的日本字形中有超过 4000 个需要在 1.000 版之前被删除,以便为有据且重要的繁体中文字形腾出空间。

因为思源宋体在 1.000 版中没有提供有意义的香港字体支持,所以包含了 6000 个左右的额外日本字形。 请注意,作为 2.000 版更新的一部分,其中约 4000 个将被删除,以便为有意义地支持香港所需的附加香港字形腾出空间,这引导我们进入本文的最后一部分。

这样做的实际效果是,当比较当前的思源黑体和思源宋体时,特别是在使用日语和朝鲜语字体和字体实例时,或这些语言被标记时,一些字符的字形可能会有所不同。

特殊字形

一个词 → Biáng

香港字形

思源黑体支持符合香港增补字符集—2008 标准的码位,但其字形并不一定符合香港的规范。 我们决定等到香港增补字符集—2016 能够提供更有意义的支持时,将以适当的字形和单独的香港字体和字体实例的形式出发布。

对于思源宋体,我们决定将对香港的支持推迟到 2.000 版,主要是为了避免做最后需要重复作业。 包含的少量香港字形是为了填补空缺。 我的预估是,需要增加约 4500 个新的香港字形,以提供足够的支持。

回想起来,包含额外日本表意文字似乎是一个好主意,因为它们是支持额外字形的一个很好的缓冲区。 最后可以删除其中一些,为更为关键的字形腾出空间。

思源宋体 Adobe 版(Source Han Serif)与 Google 版(Noto Serif CJK Version 1.001)

最后,我想宣布,今天,思源宋体 Adobe 版(Source Han Serif)和 Google 版(Noto Serif CJK 1.001 版)发布 13,包含这些最新的字体实例,以及 Multiple-Family Super OTC 版本 。本文的一些细节基于思源宋体 1.001 版。

请享用!


 

(译)注:

  1. Source Han 字体家族和 Noto CJK 字体家族基本相同,可参阅前两篇文章的译注,本篇文章不涉及这两者的差别,故而采用译名中文名称。相关问题不再赘述,请参考 往期文章
  2. Adobe 方面思源黑体字重从细到粗:

    ExtraLight—0,Light—160,Normal—320,Regular—420,Medium—560,Bold—780,Heavy—1000;

    Google 方面:

    Thin,Light,DemiLight,Regular,Medium,Bold,Black。

    Adobe 方面思源宋体字重从细到粗:

    ExtraLight—0,Light—95,Regular—210,Medium—360,SemiBold—510,Bold—730,Heavy—1000;

    Google 方面:

    ExtraLight,Light,Regular,Medium,SemiBold.,Bold,Black。

  3. 大五码 :Big5,繁体中文社区中最常用的电脑汉字字符集标准,共收录 13060 个汉字,早期非官方标准,后来在台湾和香港地区官方化。
  4. GB 18030:全称:“国家标准 GB 18030-2005《信息技术 中文编码字符集》”,是中华人民共和国现时最新的变长度多字节字符集。对 GB 2312-1980 完全向后兼容,与 GBK 基本向后兼容;支持 GB 13000(Unicode)的所有码位;共收录汉字 70244 个。
  5. JIS 标准:日本工业规格,这里特值思源字体家族支持的  JIS X 0208(七位元及八位元之双字节资讯交换用符号化汉字集)、JIS X 0213(七位元及八位元之双字节资讯交换用符号化扩展汉字集)和  JIS X 0212(资讯交换用汉字符号—补助汉字)。
  6. KS X 1001:韩国用于书写的谚文和汉字的字符编码规格。包含谚文 2350 字、汉字 4888 字、英文字母、数字和假名合计 8226 字。
  7. KS X 1002:韩国“信息交换符号扩展集”,最新标准为 2001 年发布的 KS X 1002:2001。
  8. 香港增补字符集:HKSCS(Hong Kong Supplementary Character Set),是香港政府基于大五码扩展的字符集标准,是现时香港的中文信息交换内码标准。最新版本为 2009 年 12 月推出的 HKSCS-2008,收录 5009 个字符。
  9. UROUnified Repertoire and Ordering,参照中日韩统一表意文字。
  10. Adobe-Japan1-6:完全支持目前的 JIS 的 PostScript 字符集标准。
  11. cmap:Character To Glyph Index Mapping Table,字符到字形索引映射表,OpenType 字体表之一,定义字符代码与字体中使用的字形索引值的映射。
  12. UVSes:Unicode Variation Sequences,Unicode 字形指示序列。
  13. Sans-serif & Serif:无衬线字体和衬线字体,来自西文的字体设计风格概念,大体上相对的汉字字体是黑体和宋体,但这种对应并不十分严谨。

发表评论

电子邮件地址不会被公开。 必填项已用*标注