2017 年 6 月 20 日,Unicode 标准 10.0 版现正式发布。这是第一次在同一天发布 核心规范 和数据文件。10.0 版添加了 8518 个字符,共计 136690 个字符,包括 4 种新的文字,总共 139 种文字,以及 56 个新的表情符号。

新增文字

10.0 版中新增的文字 1 和字符增强了对于较少使用的语言和世界范围内独特书写需求的支持,包括:

  • Masaram Gondi——印度中部及东南部书写 Gondi 语的文字
Masaram Gondi 语复辅音
  • 女书 ——20 世纪下叶前中国妇女用来书写诗歌等的文字

 

女书,U+1B170–U+1B2FF
  • 索永布文字和 Zanabazar Square——历史悠久的佛教文字,用于书写梵文,藏文,蒙古文
索永布文字,U+11A50–U+11AAF
Zanabazar Square,U+11A00–U+11A4F
  • 用于写叙利亚马拉雅拉姆语 2 的叙利亚字母
叙利亚马拉雅拉姆语,U+0860–U+086F
  • 伊斯玛仪派 3Khoja 社群 4 用于将阿拉伯文字译成古吉拉特文的古吉拉特语 5 符号
古吉拉特文, U+0A80–U+0AFF
  • 日本使用的一套 285 个变体假名字符(平假名字符在历史上的变体)
变体假名与父表意文字对比
其他变体假名示例
  • 中日韩统一表意文字扩展区 F(7473 个汉字)
中日韩统一表意文字扩展区 F 范围为 U+2CEB0–U+2EBE0,本张示例为 U+2CEB0-U+2CEFF

新增符号(重要)

  • 比特币符号
比特币符号,U+20BF
  • 一组 Typicon 6 标记和符号
Typicon Kavyka 符号
  • 56 个表情符号

包括法师、椰子、西兰、花仙子、吸血鬼、三明治、饺子、筷子等等

新增的 56 个 Emoji
饺子,U+1F95F
筷子,U+1F962

新增 Unicode 规范(重要)

  • UTS#10,Unicode 排序算法 – 排序 Unicode 文本
  • UTS#39,Unicode 安全机制 – 减少 Unicode 欺骗
  • UTS#46,Unicode IDNA 兼容性处理 -对非 ASCII URL 的 兼容性处理

Unicode 10.0 包含许多更改,一些 Unicode 标准的附件对 Unicode 10.0 进行了修改,通常是与字符属性的更改一致,特别是 UAX#14UAX#29UAX#31 的变化。 此外,UAX#50 – 竖排文本布局,已被引入并作为标准的一部分。


Unicode 标准是世界各地所有现代软件和通信的基础,包括所有现代操作系统,浏览器,笔记本电脑和智能手机以及互联网和 Web(URL,HTML,XML,CSS,JSON 等),其相关标准和数据亦构成了通用区域数据存储库(Common Locale Data Repository, CLDR)和 Unicode 国际组件(International Components for Unicode, ICU)的基础。

包括 239 个新的表情符号在内的所有额外的 8518 个字符,现在可供采用,以帮助 Unicode 学术学会在弱势语言数字化方面的工作。

Unicode 学术学会是一个非盈利的慈善组织,是为发展、扩展和推广使用 Unicode 标准而建立的,Unicode 学术学会设立了现代软件产品和标准文本的表示法。学术学会的会员代表了广泛领域的计算机和资讯工业的公司和组织,包括 Adobe、Apple、EmojiXpress、Facebook、Google、孟加拉国政府、印度政府、华为、IBM、微软、Monotype Imaging、Netflix、阿曼苏丹国宗教事务部、Oracle、马拉国家发展研究所、SAP,赛门铁克、Tamil Virtual University、加利福尼亚大学(伯克利分校),以及超过一百名助理、联络人员和个人会员。学术学会只由会员提供资金。Unicode 学 术学会的会员资格开放给世界上 任何支持 Unicode 标准和希望协助其扩展和执行的组织及个人。大家都可通过捐赠来支持学术学会的重要工作。


 

(译)注:

  1. 文字,Script,在 Unicode 中指用于在一个或多个书写系统中表示文本信息的字母和其他书写符号的集合。
  2. 叙利亚马拉雅拉姆语,Suriyani Malayalam,也被称作 Karshoni 或 Syriac Malayalam,是一种以叙利亚文字的变体形式书写的马拉雅拉姆方言,在印度的喀拉拉邦的圣托马斯基督教徒中受到欢迎。
  3. 伊斯玛仪派,Ismaili,伊斯兰教什叶派的支派之一。
  4. Khoja 社群,居住于在印度古吉拉特邦、马哈拉施特拉邦、拉贾斯坦邦等地,亦有迁徙定居东非、欧洲和北美。
  5. 古吉拉特语,是印欧语系印度-伊朗语族的印度-雅利安语支,为印度 22 种官方语言与 14 种地区性语言之一,同时也是巴基斯坦少数民族语言。
  6. Typicon,来自俄罗斯东正教和其他东正教以及希腊拜占庭礼天主教会使用的礼拜书。

发表评论

电子邮件地址不会被公开。 必填项已用*标注