Unicode字符集,UTF8 和UTF16编码后的数据是不同的
这个编码后的数据,也就是字节 , 他们是不一样的
同样的一个编码值,在不同的字符集中,可能代表着不同的字符
所以字符与字节之间,必然有编码参与其中...这个编码环节是必然存在的,否则,你就没办法把字节与字符联系起来
一个字符可以根据 字符集编码 进行多种方式的编码一个字节数组也可以根据 字符集编码 进行多种方式的解码 对于同一个字符,不管进行何种编码...11111.txt中,存储了一个汉字春天的 " 春" 编码方式是UTF8二进制软件查看是E6 98 A5与我们进行UTF8 编码计算的结果是对应的
ANSI编码不同的国家和地区制定了不同的标准由此产生了...A5
对于下面所有的getBytes来说,"春" 这个字符形状符号是不变的
获得的字节数组就是 这个字符形状符号 根据不同字符集编码方式, 编码而得到的字节数组
下面的各种转换换一个描述就是:UTF8... 获取指定个代码点后的索引那么截取的绝对不会是乱码看一个例子0x1f310的高代理位在Character简介中计算过,它的值跟十进制的55356一样的对于s 截取后,子串中仅仅是高代理项了
大小写转换