开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

Python正则表达式匹配包含关键字的完整句子，并且不会中断不结束句子的句点(.com、U.S.等)

Python正则表达式是一种强大的文本处理工具，可以用于匹配、搜索和替换字符串。正则表达式可以用来匹配包含特定关键字的完整句子，并且不会中断不结束句子的句点。

在Python中，可以使用re模块来操作正则表达式。下面是一个示例代码，演示如何使用正则表达式匹配包含关键字的完整句子：

import re

text = "This is a sample sentence. It contains the keyword 'example'. Another sentence follows."

# 定义要匹配的关键字
keyword = "example"

# 使用正则表达式匹配包含关键字的完整句子
pattern = r"(?<!\w\.\w.)(?<![A-Z][a-z]\.)(?<=\.|\?)\s[A-Z][a-z].*?(?=\.)"
sentences = re.findall(pattern, text)

# 打印匹配到的句子
for sentence in sentences:
    if keyword in sentence:
        print(sentence)

上述代码中，首先定义了要匹配的关键字为"example"。然后使用正则表达式模式来匹配包含关键字的完整句子。正则表达式模式中的(?<!\w\.\w.)(?<![A-Z][a-z]\.)(?<=\.|\?)\s[A-Z][a-z].*?(?=\.)部分用于匹配完整句子，不会中断不结束句子的句点。最后，使用re.findall()函数找到所有匹配的句子，并打印出包含关键字的句子。

关于正则表达式的更多详细信息和用法，可以参考腾讯云的产品文档：Python正则表达式。

请注意，以上答案仅供参考，具体的实现方式可能因实际需求和环境而有所不同。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

分钟学会正则表达式(译)

正则表达式（“regexes”）即增强查找/字符串替换操作。当在文本编辑器中编辑文字时，正则表达式经常用于：检查文本是否包含一个给定的模式查找任何匹配的模式从文本中拉取信息（比如截断）修改文本和文本编辑器一样，绝大多数高级编程语言支持正则表达式。在本文中，“文本”仅仅是一个字符串变量，但是有效的操作却是一致的。某些编程语言（Perl，JavaScript）甚至为正则表达式提供专用的语法。但是正则表达式是什么？一个正则表达式仅仅为一个字符串。它没有长度限制，但是通常该字符串很短。下面看几个例子：

JavaScript之正则表达式的使用方法详细介绍[通俗易懂]

本期博客带大家了解一下JavaScript中如何使用正则表达式，那么最开始，序言的”序言”部分，我先解释一下为什么有这篇文章：

02

基于Python的语料库数据处理（五）

正则表达式 regular expression)是用来进行较复杂文本处理,特别是复杂的查找或替换处理的计算机语言。我们在进行计算机编程或者文本处理时,通常需要进行一些文本的查找、替换。如果查找或替换的工作比较复杂,就需要借助正则表达式来完成。又如,我们需要对文本进行清洁处理（如一次删除所有词性赋码）或者提取文本的特定信息时,往往也需要使用正则表达式。因此,正则表达式在语料库语言学或计算语言学研究中使用非常广泛。

02

正则表达式学习

重要声明，本文转载自 : https://github.com/ziishaned/learn-regex

02

嘀~正则表达式快速上手指南（下篇）

上面的代码中用 for 循环去遍历 contents 这样我们就可以一个一个处理每封邮件。我们创建一个字典， emails_dict,这将保存每个电子邮件的所有细节，如发件人的地址和姓名。事实上，这些是我们要寻找的第一项信息。

01

正则表达式太慢？这里有一个提速100倍的方案（附代码）

作者：Vikash Singh 编译：肖依月、吴双、钱天培 “当遇到一个文本处理问题时，如果你在第一时间想到了正则表达式，那么恭喜你，你的问题从一个变成了俩！“ 如果你曾参与过文本数据分析，正则表达式（Regex）对你来说一定不陌生。词库索引、关键词替换……正则表达式的强大功能使其成为了文本处理的必备工具。然而，在处理大文本的情境下，正则表达式的低效率却常常让人抓耳挠腮。今天，文摘菌将为你介绍一款比正则表达式快数百倍的Python库——FlashText。让人抓狂的数据清洗工作即便是最简单的文本分析，

04

sed 命令+正则表达式

sed是一个非交互性性文本编辑器, 它编辑文件或标准输入导出的文件拷贝。标准输入可能是来自键盘、文件重定向、字符串或变量,或者是一个管道文件。sed可以随意编辑小或大的文件,有许多 sed命令用来编辑、删除,并允许做这项工作时不在现场。sed一次性处理所有改变,因而变得很有效,对用户来说,最重要的是节省了时间。sed必须通过行号和正则表达式指定要改变的文本行

02

FINDSTR正则表达式小结

前言：最近写了一个bat用于快速编译swf至目标目录，想利用FINDSTR命令通过匹配目标目录名称，匹配数量大概600多个，发现匹配耗时比较久，大概花费10余秒，因此还是放弃字符匹配，乖乖拼出全称来定位目录。感觉bat的运行效率是比较低的。

02

笔记·正则表达式和re库

提示：本页面转载内容过多，所使用的参考资料全部放在最后一章中本页面的内容不会获得任何收益，同样本页面的内容也不会发送到任何第三方平台中，White_mu收集此页面的内容仅仅是便于自己学习，如果这触碰了您的利益，请您联系我们：WhitemuTeam@outlook.com

03

正则表达式中零宽断言的用法

了解了正则表达式，想必一般情况下的匹配都不会出现什么问题，但是如果一些特殊情况，可能需要用到一些更高级的正则表达式匹配操作，本节我们来说明一下正则表达式的一个较常用又比较重要的知识点——零宽断言。实例引入首先我们来看一个例子，这里有一段问答对话：问：我用的是Windows XP+Service Pack 2，为什么无法安装输入卡号和密码的控件？答：在Windows XP+Service Pack 2、Windows 2003等操作系统中，用户可以自己选择是否安装控件。问：为什么我看到的卡号输入框

04

Bash 脚本：正则表达式基础篇

正则表达式（简写为 regex 或者 regexp）基本上是定义一种搜索模式的字符串，可以被用来执行“搜索”或者“搜索并替换”操作，也可以被用来验证像密码策略等条件。编译自　|　http://linuxtechlab.com/bash-scripting-learn-use-regex-basics/ 作者　|　Shusain 译者　|　kimii 正则表达式Regular expressions（简写为 regex 或者 regexp）基本上是定义一种搜索模式的字符串，可以被用来执行“搜索”或者“搜

08

常见的正则表达式解读释义

又名：写给正在学习前端的女友看的常见正则表达式解读。原文发布于 https://www.zybuluo.com/wddpct/note/728081 。 1. 归纳定义对给定的字符集：Σ={c1,c2,c3,……,cn} 空串ε是一个正则表达式对于任何的c∈Σ，c是正则表达式如果M和N都是正则表达式，则以下也是正则表达式选择 M|N = {M,N} 连接 MN = {mn,m∈M，n∈N} 2. 保留字符这节中的表格内容来自正则表达式30分钟入门教程，对此表示感谢。 2.1 常用的元字符

09

Linux 常用命令 vim常用命令速查

在进行系统维护时，经常会出现内存使用量惊人，而又不知道是哪一个进程占用了大量进程的情况。除了可以使用top命令查看内存使用情况之外，还可以使用下面的命令：

03

Java 正则表达式：语法讲解和常用表达式汇总

正则表达式定义了字符串的模式；正则表达式可以用来搜索、编辑或处理文本；正则表达式并不仅限于某一种语言，但是在每种语言中有细微的差别。

02

NLP将迎来黄金十年，7个案例带你入门（附Python代码）

导读：近日，微软研究院发文称，NLP即将迎来“黄金十年”。他们认为，各领域对NLP的需求会大幅度上升，对NLP质量也提出更高要求。如果你想赶上这“黄金十年”，现在好好学习还来得及！

03

Python中的正则表达式

句点(.)符号匹配除了换行符\n以外的任何字符。无论字母、数字、空格(不包括\n换行符)、可打印字符、不可打印字符，使用.都可以匹配。

03

Python 自动化指南（繁琐工作自动化）第二版：七、使用正则表达式的模式匹配

我们每天还会识别各种其他文本模式：电子邮件地址中间有@符号，美国社会保障号码有九位数字和两个连字符，网站 URL 通常有句点和正斜杠，新闻标题使用标题大小写，社交媒体标签以#开头且不包含空格，等等。

04

还不会正则表达式？看这篇！

正则表达式是很多程序员，甚至是一些有了多年经验的开发者薄弱的一项技能。大家都很多时候都会觉得正则表达式难记、难学、难用，但不可否认的是正则表达式是一项很重要的技能，所有我将学习和使用正则表达式时的关键点整理如下，供大家参考。

01

还不会正则表达式？看这篇！

正则表达式是很多程序员，甚至是一些有了多年经验的开发者薄弱的一项技能。大家都很多时候都会觉得正则表达式难记、难学、难用，但不可否认的是正则表达式是一项很重要的技能，所有我将学习和使用正则表达式时的关键点整理如下，供大家参考。

04

还不会正则表达式？看这篇！

正则表达式是很多程序员，甚至是一些有了多年经验的开发者薄弱的一项技能。大家都很多时候都会觉得正则表达式难记、难学、难用，但不可否认的是正则表达式是一项很重要的技能，所有我将学习和使用正则表达式时的关键点整理如下，供大家参考。

02

正则表达式是个啥

前些天有运营 MM 问小鸡君，正则表达式是个啥啊？懂技术的同学可能会想，你个运营管啥是正则表达式干啥？

02

Oracle中的正则表达式(及函数)详解

在介绍函数前，这里先说明一下Oracle中正则表达式运算符及其描述。如果不知道他们有什么用，或者也不知道描述说的是什么，没关系，可以先看后面的介绍，就知道他们的含义了。

04

正则表达式来了，Excel中的正则表达式匹配示例

当需要在单元格区域中找到某个值时，可以使用MATCH函数。在单元格中查找特定字符串时，FIND函数和SEARCH函数非常方便。如何知道单元格中是否包含与给定模式匹配的信息？显然，可以使用正则表达式。

03

Python——正则表达式特殊符号及用法

由于正则表达式的内容比较多，所以单独写成一系列文章，主要内容是根据小甲鱼所讲的内容综合一下正则表达式的笔记。贴上小甲鱼的《Python3 如何优雅地使用正则表达式》系列可观看的博客地址：http:/

【JS】380- JavaScript 正则新特性

如果你曾用 JavaScript 进行过复杂的文本处理操作，那么你将会喜欢 ES2018 中引入的新特性。本文将详细介绍第9版标准如何提高 JavaScript 的文本处理能力。

02

Java 异常处理与正则表达式详解，实例演练及最佳实践

在 Java 代码执行期间，可能会发生各种错误，包括程序员编码错误、用户输入错误以及其他不可预料的状况。

01

C#中的正则匹配和文本处理

在博客之前上章讲了String类和StringBuilder类。尽管String类和StringBuilder类提供了一套方法用来处理基于字符串的数据, 但是正则表达式和支持它的类却为字符串处理任务提供了更强大的功能. 大多数字符串处理工作都需要在字符串中寻找特定排列规则的子串, 通过称为正则表达式的特殊语言就可以完成这个人无. 在本章大家会了解到创建正则表达式的方法以及如何利用它们解决常见的文本处理任务。

04

JavaScript基本词法

JavaScript 语法就是指构成合法的 JavaScript 程序的所有规则和特征的集合，包括词法和句法。简单描述如下：词法定义了 JavaScript的基本名词规范，包括字符编码、命名规则、标识符、关键字、注释规则、运算符和分隔符等。句法定义了 JavaScript的基本运算逻辑和程序结构，包括短语、句子和代码段的基本规则，如表达式、语句和程序结构等。

02

正则表达式

正则表达式(regular expression)描述了一种字符串匹配的模式（pattern），可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。正则表达式作为一个模板，将某个字符模式与所搜索的字符串进行匹配。特殊符号：

03

Java 正则表达式的用法和实例

6、\S符号：非空字符 7、\s符号：空字符，只可以匹配一个空格、制表符、回车符、换页符，不可以匹配自己输入的多个空格。 8、\r符号：空格符，与\n、\tab相同

03

Python实战之特定文本提取，挑战高效办公的第一步

最近很多地方都在宣传Python的自动化办公的强大之处，那么今天大灰狼就来和大家分享一个Python自动化办公的实战项目。

02

grep中使用"\d"匹配数字不成功的原因

首先正则表达式分为三类（man grep可以看到，分别是basic RegExs，extended RegExs，perl RegExs）

01

周末在学习正则，学习过程中发现这 6 个方便的正则表达式

几乎所有流行的编程语言都支持正则表达式，因为正则实在是太强大了，它能让我们原本需要数十行代码才能完成的，正则大哥一行就能搞定了。

03

程序员必知的LinuxShell命令

程序员必知的LinuxShell命令 grep (Globle Regular Expression Print全局正则表达式) 命令是一种强大的文本搜索工具，它能使用正则表达式搜索文本，并把匹配的

07

mysql 必知必会整理—sql 正则表达[五]

正则表达式是用来匹配文本的特殊的串（字符集合）。如果你想从一个文本文件中提取电话号码，可以使用正则表达式。如果你需要查找名字中间有数字的所有文件，可以使用一个正则表达式。如果你想在一个文本块中找到所有重复的单词，可以使用一个正则表达式。

02

这些 grep 常用技巧你都会吗？

在Linux和Unix操作系统中，grep是一种在文本文件中搜索字符串的命令行工具。以下是grep命令的一些常用技巧：

04

jq正则表达式_JAVA 正则表达式

正则表达式(英语：Regular Expression，在代码中常简写为regex、regexp或RE)使用单个字符串来描述、匹配一系列符合某个句法规则的字符串搜索模式。

02

python3从零学习-5.4.8、fnmatch — Unix文件名模式匹配

来匹配文件名的各个部分)。类似地，以一个句点打头的文件名也不是此模块所特有的，可以通过

01

如何用 Python 和正则表达式抽取文本结构化信息？

例如在咱们之前介绍过的《贷还是不贷：如何用 Python 和机器学习帮你决策？》和《如何用 Python 和深度神经网络锁定即将流失的客户？》中，你都看到了，机器模型更喜欢被结构化的表格信息来喂养。

03

Python中的正则表达式（二）

在上一篇（《Python正则表达式（一）》）中，已经介绍了正则表达式的基本含义，并且对re模块中的元字符[ ]进行了说明，本文接续上文，介绍有关元字符。

01

第二十章 : 正则表达式

In the next few chapters, we are going to look at tools used to manipulate text. As wehave seen, text data plays an important role on all Unix-like systems, such as Linux. Butbefore we can fully appreciate all of the features offered by these tools, we have to firstexamine a technology that is frequently associated with the most sophisticated uses ofthese tools — regular expressions.

01

Python处理正则表达式超时的办法

最近在项目中遇到一个问题，就是需要采用正则匹配一些疑似暗链和挂马的HTML代码，而公司的老大给的正则表达式有的地方写的不够严谨，导致在匹配的时候发生卡死的现象，而后面的逻辑自然无法执行了。虽然用正则表达式来判断暗链和挂马可能不那么准确或者行业内很少有人那么做，但是本文不讨论如何使用正确的姿势判断暗链挂马，只关注与正则超时的处理。在使用正则表达式的时候，如果正则写的太糟糕，所消耗的时间是惊人的，并且有可能会一直回溯，而产生卡死的现象，所以一般的大型公司都会有专门的人来对正则进行优化，从而提高程序效率。一般来说如果可能的话不要让用户来输入正则进行匹配。但是现在既没有专门的人进行正则的优化，本人也对正则了解的不够，所以只能从另外的角度来考虑处理超时的问题。首先我想到的方法是另外开启一个线程来进行匹配，而在主线程中进行等待，如果发现子线程在规定的时间内没有返回就kill掉子线程。这也是一个方案，但是我现在要介绍另外一种方案，该方案来自我在网上看到的一篇博客.

03

Python正则表达式-re模块奇技淫巧

正则表达式作为计算机科学的一个概念，通常被用来检索、替换那些符合某个规则的文本。正则表达式是对字符串操作的一种逻辑公式，用事先定义好的规则字符串对字符串进行过滤逻辑处理。

03

30分钟玩转「正则表达式」

推荐阅读：Jeffrey Friedl 《精通正则表达式（第3版）》，本文是该书的读书笔记。

01

C# 正则表达式

转载：http://www.runoob.com/csharp/csharp-regular-expressions.html 正则表达式是一种匹配输入文本的模式。.Net 框架提供了允许这种匹配的正则表达式引擎。模式由一个或多个字符、运算符和结构组成。定义正则表达式下面列出了用于定义正则表达式的各种类别的字符、运算符和结构。字符转义字符类定位点分组构造限定符反向引用构造备用构造替换杂项构造字符转义正则表达式中的反斜杠字符（\）指示其后跟的字符是特殊字符，或应按原义解释该字符。

05

C# 正则表达式

转载：http://www.runoob.com/csharp/csharp-regular-expressions.html 正则表达式是一种匹配输入文本的模式。.Net 框架提供了允许这种匹配的正则表达式引擎。模式由一个或多个字符、运算符和结构组成。定义正则表达式下面列出了用于定义正则表达式的各种类别的字符、运算符和结构。字符转义字符类定位点分组构造限定符反向引用构造备用构造替换杂项构造字符转义正则表达式中的反斜杠字符（\）指示其后跟的字符是特殊字符，或应按原义解释该字符。

02

编译器架构 ( Compiler Architecture )

简单讲，编译器就是将“一种语言（通常为高级语言）”翻译为“另一种语言（通常为低级语言）”的程序。一个现代编译器的主要工作流程：

02

Javascript正则构造函数与正则表达字面量&&常用正则表达式

本文不讨论正则表达式入门，即如何使用正则匹配。讨论的是两种创建正则表达式的优劣和一些细节，最后给出一些常用正则匹配表达式。　　Javascript中的正则表达式也是对象，我们可以使用两种方法创建正则表达式：使用new RegExp()构造函数使用正则表达字面量　　先说结果，使用正则表达字面量的效率更高。　　下面的示例代码演示了两种可用于创建正则表达式以匹配反斜杠的方法： 1 //正则表达字面量 2 var re = /\\/gm; 3 4 //正则构造函数 5 var reg =

04

嘀~正则表达式快速上手指南（上篇）

作为数据科学家，快速处理海量数据是他们的必备技能。有时候，这包括大量的文本语料库。例如，假设要找出在 Panama Papers（https://en.wikipedia.org/wiki/Panama_Papers）泄密事件中邮件的发送方和接收方，我们需要详细筛查1150万封文档！我们可以手工完成上述任务，人工阅读每一封邮件，读取每一份最后发给我们的邮件，或者我们可以借助Python的力量。毕竟，代码存在的一个至关重要的理由就是自动处理任务。

02

Python自动化测试-正则表达式解析

对于正则表达式，第一眼时觉得完全没有规律可寻，而且全是一堆各种各样的特殊符号，完全不知所云。其实唯一难的就是组合起来之后，可读性比较差，而且不容易理解，其实能看得懂简单的正则表达式，写得出简单的正则表达式，用以满足日常的需求即可。学习正则表达式的最好方法是从例子开始，理解例子之后再自己对例子进行修改实践。

03

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭