首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

python基础操作——正则表达式

一、匹配单个字

表达式

含义

\d

匹配一个数字,等价于0-9之间的任意一个数字,通过[数字]/[起始数字-结尾数字]可以具体指定匹配数字的范围

\w

匹配单词字符,即a-z、A-Z、0-9、_

\W

大写W匹配非单词字符

.

匹配任意1个字符(除了\n)

[]

匹配[]中列举的字符

\D

匹配非数字,即不是数字

\s

匹配空白,即空白,tab键

\S

匹配非空白

[0123456789] == [0-9]

[123678] == [1-36-8]

字母同样的逻辑处理:[a-z],表示匹配a到z之间的任意一个字母

二、匹配多个字符

通过来限制需要匹配的特定内容出现的次数,例如match(r'数字\d', '数字123'),表示匹配“数字”后面有两个数字的字符串,如果超

出指定的范围,取到范围处为止,如果不够指定范围长度,则报错

match(r'内容\d','内容12'),表示匹配'内容后面有一个或两个数字的字符串',如果超出指定的范围,则按最大范围取匹配内容

* 匹配前一个字符出现0次或者无限次,即可有可无

+ 匹配前一个字符出现1次或者无限次,即至少有1次

? 匹配前一个字符出现1次或者0次,即要么有1次,要么没有

匹配前一个字符出现m次

匹配前一个字符出现从m次到n次

三、匹配开头结尾

开头:^

结尾:$

四、匹配分组

| 匹配左右任意一个表达式

(ab) 将括号中字符作为一个分组

\num 引用分组num匹配到的字符串

(?P) 分组起别名

(?P=name) 引用别名为name分组匹配到的字符串

五、re模块高级用法

search:搜索和查询内容相匹配的数据值

re.search(r'\d+', '阅读量 999').group() 会返回999

findall:返回所有和查询内容相匹配的数据值,返回列表

re.findall(r'\d+', 'python=999,c=7890') 会返回[999, 7890]

sub:将匹配到的数据进行替换

re.sub(r'正则匹配规则', '新内容', '数据') 运行原理,会优先进行正则匹配,如果有匹配上的内容就将其替换为新内容

split:根据匹配进行切割字符串,返回一个列表

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20230410A057NU00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长 进交流群

领取专属 10元无门槛券

私享最新 技术干货

扫码加入开发者社群
领券