首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Python处理中文标点符号

    中文文本中可能出现的标点符号来源比较复杂,通过匹配等手段对他们处理的时候需要格外小心,防止遗漏。以下为在下处理中文标点的时候采用的两种方法: 中文标点集合 比较常见标点有这些: 1 !?...调用zhon包的zhon.hanzi.punctuation函数即可得到这些中文标点。 如果想用英文的标点,则可调用string包的string.punctuation函数可得到: 1 !"...@[\\]^_`{|}~ 因此,比如需要将所有标点符号去除,可以进行以下操作: 1 2 3 4 >>> import re >>> from zhon.hanzo import punctuation...去除标点。。"...punctuation) line = re.sub(re_punctuation, "", line) return line.strip() 清洗完毕后,有时候我们希望按照多个标点符号来分割

    9K40

    3,变量与标点符号

    一,变量 1,标识符的命名规则 在Python中,变量、函数或类的名称都叫做标识符。 标识符由字母、数字、下划线组成,区分大小写,不能以数字开头。...用户定义的标识符不能和Python关键字或内部函数相同,否则可能会出现错误。 ? 2,基本数据类型 ? ?...二,常用标点符号 1,用4个空格表示缩进 Python不使用大括号或者 end 关键字来控制判断、循环、函数和类的 代码范围, 而是使用缩进来写实现代码分组。通常用4个空格来进行缩进。 ?...其它标点符号的作用在后面学习过程中会陆续学到。 三,思考练习 5,观察下面代码,总结字符串类型和整数类型转化成布尔变量类型的规律是什么样的? (回复关键字 python05 查看参考答案) ?...(回复关键字 python06 查看参考答案) ?

    90920
    领券