腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
Unicode
编码
我有一个问题,如果程序事先不知道所使用的
编码
,它们如何解析字符串。 据我所知,UTF-8
编码
用1个字节存储ASII字符,而所有其他字符最多用6个字节(我想是6个)。那么,程序如何能够确定这个字符串和使用UTF-16
编码
的字符串`0x2020之间的区别,该字符串对应于单个字符,该字符明显类似于数学中有时用于表示运算符的伴随的符号(我刚刚在中查找了该符号)。似乎解析器总是必须事先知道字符串的
编码
。如果是这样,这在实践中是如何实现的?在每个字符串之前是否有一个字节告诉解析器使用了什么
编码
或其他什么?
浏览 2
提问于2011-09-08
得票数 3
回答已采纳
5
回答
这是对
Unicode
的很好的描述吗?
这是我对
Unicode
的描述。请进行更正和评论。 ANSI代码页将字符映射到字节表示形式。
Unicode
将字符映射到代码点。代码点是一个抽象的概念。
编码
方案的责任是以字节表示
Unicode
代码点。 有许多
Unicode
编码
方案。一些
编码
方案使用固定的字节数来表示
Unicode
代码点。这种方法必须平衡
编码
可以表示的
浏览 6
提问于2009-06-22
得票数 0
回答已采纳
2
回答
UCS-2如何显示UTF-8中6个字节的
unicode
代码点?
、
、
我在读到了关于
unicode
的文章。Joel说,UCS-2将所有
unicode
字符
编码
为2字节,而UTF-8可能需要6字节来
编码
某些
unicode
字符。请举例说明一下,6字节UTF-8
编码
的
unicode
字符是如何在UCS-2中
编码
的?
浏览 4
提问于2013-11-26
得票数 1
回答已采纳
2
回答
Decode函数尝试对Python进行
编码
、
、
我正在尝试打印一个没有特定
编码
十六进制的
unicode
字符串。我从facebook获取这个数据,它在UTF-8的html头中有一个
编码
类型。当我打印类型时-它说它是
unicode
的,但是当我尝试用
unicode
解码它时-转义告诉我有一个
编码
错误。当我使用decode方法时,为什么它会尝试
编码
?代码prin
浏览 2
提问于2011-01-26
得票数 7
回答已采纳
1
回答
如何使用XSLT将文本文件
编码
格式更改为
unicode
?
、
、
、
有人能帮我把文本的
编码
格式更改为
unicode
吗?我需要查看阿拉伯字符,现在我使用的是windows-1256
编码
,即使在我的文本文件中,我可以在需要
unicode
格式的字符中使用问号,这是如何实现的?
浏览 0
提问于2012-09-04
得票数 0
1
回答
SQL Server 2012中的字符
编码
、
、
我有一个数据库( Server 2012),它有大量的
Unicode
数据。插入自web应用程序但字符的记录保存在web字符
编码
‘want’中,但当浏览器显示这些数据时,它们是
Unicode
,浏览器自动将其字符
编码
更改为'
Unicode
‘,并显示字符正确,但我希望在应用程序中使用这些数据,并在真正的
Unicode
字符中进行更改。例如,字符保存在这样的表中(使用'western‘
编码
): پیشرÙت 50 درصدی مخز
浏览 2
提问于2013-12-25
得票数 0
1
回答
为什么没有以0xC1开头的
Unicode
?
、
、
在研究
Unicode
和utf-8
编码
时,我检查了0xcf的最后一个字母。 没有
Unicode
编码
为0xc1。为什么129
unicode
从0xc2开始,而不是0xc1?
浏览 2
提问于2020-01-05
得票数 0
回答已采纳
2
回答
为什么firefox中没有utf-8
编码
?
、
、
为什么firefox中没有utf-8
编码
?原因何在?
浏览 0
提问于2015-04-11
得票数 3
回答已采纳
1
回答
在python中确定
unicode
字符串解码方法的最佳方法是什么?
、
、
我想知道如何确定
unicode
的
编码
。坦率地说,我想把它变成一个utf-8
unicode
,而不会在使用它之前弄乱字符。即:utf8_
unicode</
浏览 2
提问于2012-01-26
得票数 4
3
回答
将二进制数据转换为
Unicode
、
、
、
、
在这里提供的所有
编码
中,,我应该使用哪种
编码
将二进制数据解码为
unicode
,而不会在我将其
编码
回字符串时损坏? 我用过raw_
unicode
_data,但它不起作用。Django使用utf-8将POST数据转换为
unicode
。但是,当从
unicode
转换回字符串(同样使用utf-8)时,数据会损坏。我使用了raw_
unicode
_data,也发生了同样的事情(尽管这次只有几个字节)。我应该使用哪种
编码
,以便解码和
编码</e
浏览 1
提问于2011-02-24
得票数 1
回答已采纳
1
回答
有多少
Unicode
编码
,它们都还在使用吗?
、
、
我知道以下
Unicode
编码
: 还有更多的
Unicode
编码
吗?所有的
Unicode
编码
是否还在使用,或者其中一些现在已经过时了?
浏览 3
提问于2018-04-26
得票数 0
3
回答
python中的字符串
编码
、
、
在python中,字符串可以是
unicode
( utf-16和utf-8 ),也可以是具有不同
编码
的单字节( cp1251、cp1252等)。可以检查一下
编码
字符串是什么吗?在MacOS下,返回的字符串将是utf-16,在具有英语本地语言的Windows下,它将是带有ascii
编码
的单字节,而在非英语语言环境下,它将通过语言环境的代码页进行
编码
,例如cp1251。
浏览 0
提问于2009-05-01
得票数 0
回答已采纳
3
回答
在python中的str上使用
编码
会发生什么?
、
、
、
、
我明白了
unicode
,
编码
和解码的意义。但是我不明白为什么
编码
函数可以在str类型上工作。我希望它只适用于
unicode
类型。因此,我的问题是:当
编码
用于str而不是
unicode
时,它的行为是什么?
浏览 0
提问于2016-02-26
得票数 7
回答已采纳
2
回答
'
unicode
‘和'encode’之间的关系是什么?
、
print u'\xe4\xf6\xfc'.encode('utf-8')回溯:Traceback (most recent calllast): print
unicode
(u'\xe4\xf6\xfc') UnicodeEncodeError
浏览 5
提问于2010-01-08
得票数 1
回答已采纳
1
回答
Python默认字符串
编码
、
、
、
、
Python在何时、何地以及如何隐式地将
编码
应用于字符串或隐式转换(转换)?例如,
编码
是什么: 何时将字节字符串和
Unicode
字符串写入文件或终端?
浏览 2
提问于2018-04-24
得票数 5
回答已采纳
1
回答
Python中的
Unicode
解码错误
、
、
print row[1] "s": row[0]}我不确定为什么我不能
编码
成UnicodeDecodeError: 'utf8' codec can't decode byte 0xf3 in position 36: invalid continuation byte 在我放入
编码
函数之前bson.errors.InvalidStringData: strings
浏览 3
提问于2013-02-21
得票数 0
回答已采纳
4
回答
返回
Unicode
字符串还是返回
编码
为UTF-8的普通字符串?
、
、
、
、
在Django web框架的上,作者解释了为什么添加__
unicode
__()方法比添加__str__()更好,原因如下: Django模型有一个默认的__str__()方法,它调用__
unicode
这意味着
unicode
(p) 将返回
Unicode
字符串,而 str(p) 将返回一个普通字符串,其字符
编码
为UTF-8.。我不明白
Unicode
字符串和以UTF-8
编码
的字符串之间有什么区别。我以为UTF-8是
Unicode
的
编码
之一
浏览 9
提问于2013-08-01
得票数 1
1
回答
Unicode
字符
编码
、
、
我想输出统一码字符(乌克兰语,白俄罗斯语)从DownloadString(url);。此时,它只输出英语,其他语言像符号一样显示。 { string param = "out&count=10"; string url = "https://api.vk.com/method/"+method+"
浏览 2
提问于2015-05-08
得票数 0
3
回答
Python
Unicode
编码
、
是否可以在linux上不更改系统区域设置而打印日文?日文打印的地区是ja_JP.UTF-8。但是如果我把它设置为decode('utf-8'),它会显示出所有奇怪的东西。以下是一幅图片:
浏览 7
提问于2014-12-29
得票数 0
回答已采纳
2
回答
这句话是什么意思?
在“
Unicode
默认
编码
”部分,它提到“
Unicode
实现必须对传递给它以进行强制的8位字符串进行
编码
,并假设在没有给定特定
编码
的情况下将
Unicode
转换为字符串的默认
编码
。”
浏览 2
提问于2012-10-09
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python解析“Unicode”编码格式文本
JavaScript如何正确处理Unicode编码问题
C语言/C加加程序员编程学习之unicode编码与ansi编码
Python Unicode编码混乱:来自大洋彼岸的怨念
知识点:高棉语Unicode字体编码创始人
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券