d的fg?...:
1) 首先我知道,这些表情其实也是一种文字,它可以看做某个UTF-16 的码点.可以参见这个附录:
2) 这些表情的码点在UTF-16中是有自己的范围的.而JS中可以通过正则表达式来检测一个文字的码点值...这到底是谁规定的? UTF8 是变长的,中文可能是 2-3个长度,UTF16 里面
中文和英文长度是一样的.所以我很想知道这个规则是干什么的?...PS: 这里的长度是编码单元长度,以 UTF16/UCS2 为例, 一个编码单元16位、2个字节,在UTF16下英文和中文
都是 U+0000 这样的形式,长度相等.除了部分代理对,它们的长度为2,占用...32位、两个编码单元外(有无为3的我还
真不知道)。