正则表达式(Regular Expression,简称为 RegExp 或 regex)是一种强大的文本处理工具,它使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。在 Python 中,re
模块提供了对正则表达式的支持。
正则表达式主要分为以下几类:
abc
匹配字符串 "abc"。[abc]
匹配 "a"、"b" 或 "c" 中的任意一个字符。*
、+
、?
、{n}
等,用于指定匹配次数。()
将多个字符组合成一个单元,并可以捕获匹配的文本。^
和 $
,分别表示字符串的开始和结束。\d
表示数字,\w
表示单词字符等。正则表达式广泛应用于文本处理、数据验证、日志分析、网络爬虫等领域。
以下是一个简单的 Python 示例,演示如何使用正则表达式匹配和提取文本中的电子邮件地址:
import re
text = "Please contact us at support@example.com or sales@example.net for assistance."
pattern = r'\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b'
matches = re.findall(pattern, text)
print(matches) # 输出: ['support@example.com', 'sales@example.net']
在这个示例中,我们使用了 re.findall()
方法来查找文本中所有与指定模式匹配的电子邮件地址。
re
模块:https://docs.python.org/3/library/re.html希望以上信息能够帮助您更好地理解和使用 Python 中的正则表达式。
领取专属 10元无门槛券
手把手带您无忧上云