首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >反转python对元音的编码,以规范化文本或以当前形式规范化

反转python对元音的编码,以规范化文本或以当前形式规范化
EN

Stack Overflow用户
提问于 2020-10-16 19:12:49
回答 1查看 73关注 0票数 1

Python自动将德语元音和标点符号读取为

Gefrier- undç­hlmçbel

如何规范化此输出以删除标点符号?

EN

回答 1

Stack Overflow用户

发布于 2020-10-16 20:07:20

您可以通过执行以下操作来“修复”编码问题:

代码语言:javascript
运行
复制
the_string = 'Gefrier- und Tiefkühlmöbel'.encode('latin-1').decode('utf-8')

然后应用像这样的解决方案:https://stackoverflow.com/a/518232/2452074

代码语言:javascript
运行
复制
import unicodedata
def strip_accents(s):
   return ''.join(c for c in unicodedata.normalize('NFD', s)
                  if unicodedata.category(c) != 'Mn')

strip_accents(the_string)
> 'Gefrier- und Tiefkuhlmobel'

但是首先,我会试着理解为什么你的输入看起来是错误的,Python本身不应该自动地这样做。

关于unicode和编码的一些背景文档:https://docs.python.org/3/howto/unicode.html

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/64388028

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档