了解:
值在0x0080以下的字符,会压缩为1个字节.这符合美国的标准.
值在0x0080 - 0x7FF之间,字符会转换为2个字节.这对欧洲以及东欧非常适合....值在0x0800以上的字符,都会是3个字节,适合东亚地区的语言
最后代理对被谢伟4个字节, UTF-8是一种相当流向的编码格式.但值在0x800以上,翻译为3个字节的时候,不如UTF-16编码实用.高效...UTF-32编码就是对每一个字节都编程4个字节存储.
如果打算写一个算法,处理字节数不定的字符.就可以实用这种编码....:
在C语言中,char是我们常用的数据类型,这个数据类型表示了一个8位的ANSI字符....如果源代码中,我们声明一个字符串,那么如果是C编译器,则会把字符串中的字符转换为
Char(8位)数据类型构成的一个数组.