via Wikidata · CC0
半形及全形字符是 Unicode 基本多文种平面内的最后第二个区段,范围包括 U+FF00..U+FFEF。本区段包含全形和半形字符以便可以无损从旧编码系统转换至 Unicode。该区段于 Unicode 1.0 的旧称为 半形及全形变体(Halfwidth and Fullwidth Variants)。 U+FF01..U+FF5E 编码了 ASCII 内 21 至 7E 的全形版本。U+FF00 未对应 ASCII 20 (空格)字符,该字符已经由 U+3000 IDEOGRAPHIC SPACE 表意空格取代。 U+FF65..U+FF9F 编码了JIS X 0201 内的半形片假名——参见半形假名。 U+FFA0..U+FFDC 编码了谚文KS C 5601 1974年版的諺文兼容字母。其对应的字符用于 IBM 的韩文编码页 933,其中包括 Shift In 和 Shift Out 的字符以对应双字节编码。基于双字节编码可能包括兼容字母,本区段包含了部分半形变体以便可以无损从 KS C 5601 转码至 Unicode。 U+FFE0..U+FFEE 编码了全形及半形符号。
Abstract from DBpedia / Wikipedia · CC BY-SA
Discovered by embedding cosine similarity (sentence-transformers MiniLM, 384-dim).