首页
学习
活动
专区
圈层
工具
发布
社区首页 >问答首页 >我有个文本文件。我希望搜索短语像这种格式,或标点符号或类似于混乱的词格式。我使用Python3.x。任何python库

我有个文本文件。我希望搜索短语像这种格式,或标点符号或类似于混乱的词格式。我使用Python3.x。任何python库
EN

Stack Overflow用户
提问于 2021-12-11 06:21:59
回答 1查看 20关注 0票数 -2

Test1.txt

.个人信息和人口信息。关于该服务,我们可能要求您向我们提供某些类别的信息,例如:(1) 个人人口信息,这是指您个人身份的信息,如您的姓名、电子邮件地址、邮件地址和包括信用卡号码在内的支付信息("Personal Information");(2) 人口信息,例如关于您的性别、子女、职业、教育程度和与您一起工作的年级的信息,如果您是专业教育家的话(“ are ”)。我们可以通过各种形式和在服务的各个地方收集这方面的信息,包括帐户登记表、联系我们的表单、在订购产品时或当您与服务交互时结帐。如果我们将非个人可识别人口信息与直接从您那里收集的个人信息结合起来,我们将根据thisPrivacy政策将合并的数据作为个人信息处理。

短语=‘个人信息和人口信息’

信息:-

我想在这个文本文件中搜索上面的短语。在这个文本文件中,这些短语可能是相同的,也可能是用标点符号,或者在下面或上面,标题或单词之间的空白,或者没有空格或混乱的单词。

Requirement:-返回输出,或者返回下面的短语,或者返回这些短语的位置,或者返回真假。

个人信息和人口信息,个人人口信息,个人信息,人口信息,人口信息,个人可识别的人口信息,个人信息,个人信息

EN

回答 1

Stack Overflow用户

发布于 2021-12-11 06:49:34

您可以使用regex:

代码语言:javascript
复制
with open('file.txt') as f:
    text = f.read()

import re
matches = re.findall(r'((?: personal|demographic)[\s\w]*information\b)', text, flags=re.I)

输出:

代码语言:javascript
复制
['Demographic Information',
 ' Personal Demographicinformation',
 'demographic information',
 'Demographic Information',
 'Demographic Information with the Personal Information',
 ' PERSONAL INFORMATION']
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/70313042

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档