Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >python 通过正则查找文件中字符串

python 通过正则查找文件中字符串

原创
作者头像
小白will
发布于 2019-01-25 09:28:37
发布于 2019-01-25 09:28:37
3.2K0
举报
文章被收录于专栏:学习学习

为了获取到一个html文件中的两个数据,以下使用python的 re 模块进行数据抓取。

Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式。re 模块使 Python 语言拥有全部的正则表达式功能。具体参考:http://www.runoob.com/python/python-reg-expressions.html

下图是网页源码:


以下是python源码:

# coding: utf-8

import re

import codecs

path = 'xxxxxx'

regex_str_suc = ">(\d+)\/"

with codecs.open(path, "r",encoding='utf-8', errors='ignore') as fdata:

comtent = fdata.read()

result_suc = re.findall(regex_str_suc, comtent)[0]

print result_suc


regex_str_suc 是我的正则表达式,()中是我要获取的内容,\d+ 代表要获取的是一段数字。这样就可以拿到我要取的数据了。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
用正则表达式爬取古诗文网站,边玩边学【python爬虫入门进阶】(09)
前面两篇文章我们介绍了正则表达式的基本语法以及一些简单的使用场景。还没有看的小伙伴赶紧看过来吧, 学好正则表达式,啥难匹配的内容都给我匹配上【python爬虫入门进阶】(07) 用正则表达式校验手机号,邮箱就是流弊【python爬虫入门进阶】(08) 花个几分钟就能学会的知识点为啥不学呢? 本文将正则表达式的应用进一步放大,用它来爬取古诗文网站的数据。在本文的学习中,请你暂时将xpath隐藏掉。
码农飞哥
2021/12/15
5160
用正则表达式爬取古诗文网站,边玩边学【python爬虫入门进阶】(09)
利用requests和正则表达式爬取虎扑
正则表达式 解释:符合某个模式(规则)的文本 在线测试工具:https://tool.oschina.net/regex 详细的正则表达式规则,可见:http://www.runoob.com/python3/python3-reg-expressions.html ---- re模块 概述:re为正则表达式提供了很多api,对正则表达式的使用提供了便利。 修饰符:  1、re.I:忽略大小写  2、re.M:多行匹配  3、re.S:是.匹配包括换行在内的所有字符 方法:match() 参数:正
py3study
2020/01/10
7680
Python入门进阶教程-正则表达式
将Regular Expression(正则表达式)理解成规则表达式更好,一个规则表达式(Regular Expression)通常被称为一个规则(Pattern),即我们需要找到与规则一致的文本。
小一不二三
2019/12/31
5390
【Python】高级笔记第一部分:文件读写和正则表达式
数据处理的基本目的是从大量的、可能是杂乱无章的、难以理解的数据中抽取并推导出对于某些特定的人们来说是有价值、有意义的数据。当下数据处理贯穿于社会生产和社会生活的各个领域。数据处理技术的发展及其应用的广度和深度,极大地影响了人类社会发展的进程。数据处理也是大数据,数据分析等后续科学的基本环节。
杨丝儿
2022/02/24
1K0
【Python】高级笔记第一部分:文件读写和正则表达式
两天研习Python基础(九) 文本处理
字符转换例子: https://stackoverflow.com/questions/555705/character-translation-using-python-like-the-tr-command
王诗翔呀
2020/07/06
1.1K0
《最新出炉》系列入门篇-Python+Playwright自动化测试-52- 字符串操作 - 下篇
re.match 尝试从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none。
北京-宏哥
2024/06/25
2310
《最新出炉》系列入门篇-Python+Playwright自动化测试-52- 字符串操作 - 下篇
《最新出炉》系列入门篇-Python+Playwright自动化测试-52- 字符串操作 - 下篇
在日常的自动化测试工作中进行断言的时候,我们可能经常遇到的场景。从一个字符串中找出一组数字或者其中的某些关键字,而不是将这一串字符串作为结果进行断言。这个时候就需要我们对字符串进行操作,宏哥这里介绍两种方法:正则和字符串切片函数split()。
北京-宏哥
2024/06/13
3020
《最新出炉》系列入门篇-Python+Playwright自动化测试-52- 字符串操作 - 下篇
一文搞懂 Python 正则表达式用法
作者:枫叶云 来源:见文末 Python 正则表达式 正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。 Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式。 re 模块使 Python 语言拥有全部的正则表达式功能。 compile 函数根据一个模式字符串和可选的标志参数生成一个正则表达式对象。该对象拥有一系列方法用于正则表达式匹配和替换。 re 模块也提供了与这些方法功能完全一致的函数,这些函数使用一个模式字符串做为它们的第一个参数。
小小科
2018/06/20
1.1K0
正则表达式
正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。re 模块使 Python 语言拥有全部的正则表达式功能。
AngelNH
2020/04/16
4200
python 学习笔记(9)——Python 正则表达式
正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。
my_sunshine
2020/10/15
6510
一句python,一句R︱python中的字符串操作、中文乱码、NaN情况(split、zip...)
先学了R,最近刚刚上手python,所以想着将python和R结合起来互相对比来更好理解python。最好就是一句python,对应写一句R。
悟乙己
2019/05/26
3.3K0
在Python中遇到字符串和数字要分开提取怎么办?这篇文章看完必会!
正则表达式是处理字符串的强大工具,能够匹配特定的模式。在Python中,re模块提供了正则表达式的支持。
小白的大数据之旅
2024/11/20
6450
【从零学习python 】62. Python正则表达式:强大的字符串匹配工具
正则表达式是一个特殊的字符序列,计算机科学的一个概念。通常被用来检索、替换那些符合某个模式(规则)的文本。
全栈若城
2024/02/29
1160
四、正则表达式re模块 常用的匹配规则:Python 的 re 模块也可以直接用re.match(),re.search(),re.findall(),re.finditer(),re.sub()
什么是正则表达式 正则表达式,又称规则表达式,通常被用来检索、替换那些符合某个模式(规则)的文本。 正则表达式是对字符串操作的一种逻辑公式,就是用事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符串”,这个“规则字符串”用来表达对字符串的一种过滤逻辑。 给定一个正则表达式和另一个字符串,我们可以达到如下的目的: 给定的字符串是否符合正则表达式的过滤逻辑(“匹配”); 通过正则表达式,从文本字符串中获取我们想要的特定部分(“过滤”)。 常用的匹配规则: \w 匹配字母
酱紫安
2018/04/16
3.3K0
四、正则表达式re模块	常用的匹配规则:Python 的 re 模块也可以直接用re.match(),re.search(),re.findall(),re.finditer(),re.sub()
Python中的正则表达式(二)
re.search():此方法返回None(如果模式不匹配),或者返回re.MatchObject,其中包含有关字符串的匹配部分的信息。此方法在第一个匹配项后停止,因此它最适合测试正则表达式,而不是提取数据。
用户7466307
2020/07/14
1.4K0
Python3 正则表达式
        正则表达式是用来匹配字符串的强有力武器,它的设计思想是用一种描述性的语言来给字符串定义一个规则,凡是符合规则的字符串,我们就认为它“匹配”了,否则,该字符串就是不合法的。
嵌入式视觉
2022/09/05
5030
Python3 正则表达式
正则表达式
正则表达式(regular expression)描述了一种字符串匹配的模式(pattern),可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。正则表达式作为一个模板,将某个字符模式与所搜索的字符串进行匹配。 特殊符号:
爱编程的小明
2022/09/06
7540
正则表达式
python爬虫从入门到放弃(五)之 正则的基本使用
 什么是正则表达式 正则表达式是对字符串操作的一种逻辑公式,就是 事先定义好的一些特定字符、及这些特定字符的组合,组成一个“规则字符”,这个“规则字符” 来表达对字符的一种过滤逻辑。 正则并不是pyt
coders
2018/01/04
9710
python爬虫从入门到放弃(五)之 正则的基本使用
常用正则表达式最强汇总(含Python代码举例讲解+爬虫实战)
Python的re模块(正则表达式)提供各种正则表达式的匹配操作。在绝大多数情况下能够有效地实现对复杂字符串的分析并取出相关信息。在讲解如何实际应用正则表达式之前,先教大家学习并掌握正则表达式的基本语法(匹配规则)。
Python研究者
2021/08/27
7.3K0
Python正则表达式(持续更新,各种字符串筛选,总有一款适合您当前的功能)
注:re.match弊端:只能匹配是否以某字符串为开头的内容,所以很多场合不合适。
红目香薰
2022/11/28
7010
Python正则表达式(持续更新,各种字符串筛选,总有一款适合您当前的功能)
推荐阅读
相关推荐
用正则表达式爬取古诗文网站,边玩边学【python爬虫入门进阶】(09)
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档