首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

python笔记6-%u60A0和\u60a0类似unicode解码

前言

有时候从接口的返回值里面获取到的是类似"%u4E0A%u6D77%u60A0%u60A0"这种格式的编码,不是python里面的unicode编码。

python里面的unicode编码应该是这种格式:\u4e0a\u6d77\u60a0\u60a0

一、unicode编码

1.先看下python的unicode编码:\u60a0,这个是\u开头的,里面的英文是小写

```

# coding:utf-8

# 前面加u可以直接打印中文

a = u"\u4e0a\u6d77\u60a0\u60a0"

print(a)

# 字符串需decode成默认unicode编码

b = r"\u4e0a\u6d77\u60a0\u60a0"

print(b.decode("unicode_escape"))

```

2.如果在字符串前面加个u,意思是转化成unicode编码,如果获取到的是应该字符串原型,那就需要decode解码成unicode编码,python里面默认的unicode编码名称是unicode_escape

二、 替换%

1.如果是这种带%的编码,先替换成\,这样就是unicode编码了,虽然里面的英文字符是大小,还好这里不区分大小写。

```

# coding:utf-8

c = "%u4E0A%u6D77%u60A0%u60A0"

# 解决办法一:替换%

d = c.replace("%", "\\")

print(d.decode('unicode_escape'))

```

三、解决办法二:unichr

1.先切割成单个字符,再用unichr转换成中文,再连成字符串,这个有点复杂了

```

# coding:utf-8

def switch_to_ch(f):

'''转换成中文'''

g = f.split("%u")[1:]

h = [''+unichr(int(i, 16)) for i in g]

return "".join(h)

if __name__ == "__main__":

f = "%u4e0a%u6d77%u60a0%u60a0"

ch = switch_to_ch(f)

print(ch)

```

四、python3解码

1.python3默认的编码就是unicode,这个跟python2还不太一样,如果直接给字符串decode会报错:decode("unicode_escape")

2.python3先encode成utf-8编码,再decode成默认的unicode就可以了

3.代码参考

```python3

# coding:utf-8

c = "%u4E0A%u6D77%u60A0%u60A0"

# python3解决办法:替换%

d = c.replace("%", "\\")

print(d.encode("utf-8").decode("unicode_escape"))

```

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20171218G0VQH900?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券