前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >python 通过正则查找文件中字符串

python 通过正则查找文件中字符串

原创
作者头像
小白will
发布2019-01-25 17:28:37
3.1K0
发布2019-01-25 17:28:37
举报
文章被收录于专栏:学习

为了获取到一个html文件中的两个数据,以下使用python的 re 模块进行数据抓取。

Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式。re 模块使 Python 语言拥有全部的正则表达式功能。具体参考:http://www.runoob.com/python/python-reg-expressions.html

下图是网页源码:


以下是python源码:

# coding: utf-8

import re

import codecs

path = 'xxxxxx'

regex_str_suc = ">(\d+)\/"

with codecs.open(path, "r",encoding='utf-8', errors='ignore') as fdata:

comtent = fdata.read()

result_suc = re.findall(regex_str_suc, comtent)[0]

print result_suc


regex_str_suc 是我的正则表达式,()中是我要获取的内容,\d+ 代表要获取的是一段数字。这样就可以拿到我要取的数据了。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档