开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

如何使用bs4剥离"Results for“字符串中的"Results for 2019年7月27日”？

要使用bs4剥离"Results for"字符串中的"Results for 2019年7月27日"，可以使用BeautifulSoup库中的find()和replace_with()方法来实现。

首先，导入BeautifulSoup库并创建一个BeautifulSoup对象，将要剥离的字符串作为参数传入。然后使用find()方法找到包含"Results for"的标签或元素。接下来，使用replace_with()方法将该标签或元素替换为空字符串。

下面是一个示例代码：

from bs4 import BeautifulSoup

# 创建BeautifulSoup对象
html = '<div>Results for 2019年7月27日</div>'
soup = BeautifulSoup(html, 'html.parser')

# 使用find()方法找到包含"Results for"的标签或元素
results_tag = soup.find(text='Results for')

# 使用replace_with()方法将该标签或元素替换为空字符串
results_tag.replace_with('')

# 打印剥离后的结果
print(soup.get_text())

运行以上代码，将会输出剥离后的结果：

2019年7月27日

这样就成功剥离了"Results for"字符串中的"Results for 2019年7月27日"。

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

项目实战 | Python爬虫概述与实践（二）

《项目实战 | python爬虫概述及实践（一）》中介绍了网络爬虫的定义、分类和基本流程。

01

基于bs4+requests爬取世界赛艇男运动员信息

2018年8月22日笔记新手学习如何编写爬虫，可以注册1个网易账号，在网易云课堂上学习《Python网络爬虫实战》，链接：http://study.163.com/course/courseMai

04

（数据科学学习手札33）基于Python的网络数据采集实战（1）

前面两篇文章我们围绕利用Python进行网络数据采集铺垫了很多内容，但光说不练是不行的，于是乎，本篇就将基于笔者最近的一项数据需求进行一次网络数据采集的实战；

05

Python的最大递归深度错误 “max

今天在写爬虫的时候，发现了一个事情，使用str方法强制转换一个BeautifulSoup对象成字符串的时候报错了，提示是“maximum recursion depth exceeded while calling a Python object”，意思大致是“当调用该对象超过最大递归深度”

01

数据分析从零开始实战 | 基础篇(四)

1.利用Pandas检索HTML页面（read_html函数） 2.实战训练使用read_html函数直接获取页面数据 3.基本数据处理：表头处理、dropna和fillna详解 4.基本数据可视化分析案例

02

BeautifulSoup库

python爬虫抛开其它，主要依赖两类库：HTTP请求、网页解析；这里requests可以作为网页请求的关键库，BeautifulSoup库则是网页内容解析的关键库；爬虫架构分为五部分：调度器、URL管理器、网页下载器、网页解析器、应用程序等。

03

Python-数据解析-Beautiful Soup-上

bs4 是一个 HTML/XML 的解析器，其主要功能是解析和提取 HTML/XML 数据。

02

「Python爬虫系列讲解」四、BeautifulSoup 技术

前文回顾：「Python爬虫系列讲解」一、网络数据爬取概述「Python爬虫系列讲解」二、Python知识初学「Python爬虫系列讲解」三、正则表达式爬虫之牛刀小试

02

Python 抓取新闻稿语料库

新闻联播是最权威的新闻来源，用语规范，内容涉及时政和社会的方方面面，对生活生产有着很强的指导意义。

02

[Python从零到壹] 五.网络爬虫之BeautifulSoup基础语法万字详解

欢迎大家来到“Python从零到壹”，在这里我将分享约200篇Python系列文章，带大家一起去学习和玩耍，看看Python这个有趣的世界。所有文章都将结合案例、代码和作者的经验讲解，真心想把自己近十年的编程经验分享给大家，希望对您有所帮助，文章中不足之处也请海涵。Python系列整体框架包括基础语法10篇、网络爬虫30篇、可视化分析10篇、机器学习20篇、大数据分析20篇、图像识别30篇、人工智能40篇、Python安全20篇、其他技巧10篇。您的关注、点赞和转发就是对秀璋最大的支持，知识无价人有情，希望我们都能在人生路上开心快乐、共同成长。

01

如何利用BeautifulSoup库查找HTML上的内容

比如我们在http://python123.io/ws/demo.html这个简单的网页中找到与a和b标签相关的内容。

04

网页解析之Beautiful Soup库运用

今日分享：Beautiful Soup库简单应用一句话来理解 Beautiful Soup库就是：它是解析遍历维护标签树的功能库。以下是BeautifulSoup库的文档链接：官方链接https://www.crummy.com/software/BeautifulSoup/bs4/doc/ 中文链接https://www.crummy.com/software/BeautifulSoup/bs4/doc.zh/ 下面根据一个示例来了解学习BeautifulSoup库： >>> import req

07

图解爬虫，用几个最简单的例子带你入门Python爬虫

爬虫一直是Python的一大应用场景，差不多每门语言都可以写爬虫，但是程序员们却独爱Python。之所以偏爱Python就是因为她简洁的语法，我们使用Python可以很简单的写出一个爬虫程序。本篇博客将以Python语言，用几个非常简单的例子带大家入门Python爬虫。

02

Java 编程问题：三、使用日期和时间

本章包括 20 个涉及日期和时间的问题。这些问题通过Date、Calendar、LocalDate、LocalTime、LocalDateTime、ZoneDateTime、OffsetDateTime、OffsetTime、Instant等涵盖了广泛的主题（转换、格式化、加减、定义时段/持续时间、计算等）。到本章结束时，您将在确定日期和时间方面没有问题，同时符合您的应用的需要。本章介绍的基本问题将非常有助于了解日期-时间 API 的整体情况，并将像拼图中需要拼凑起来的部分一样解决涉及日期和时间的复杂挑战。

02

技术学习：Python（18）｜爬虫篇｜解析器BeautifulSoup4（一）

上一个章节，跟着老师博文学习lxml模块和Xpath，这一章节，从Python的解析器BeautifulSoup4来做解析。

02

Python入门进阶教程-时间序列

Python 标准库包含用于日期（date）和时间（time）数据的数据类型，而且还有日历方面的功能。

01

图解爬虫，用几个最简单的例子带你入门Python爬虫

爬虫一直是Python的一大应用场景，差不多每门语言都可以写爬虫，但是程序员们却独爱Python。之所以偏爱Python就是因为她简洁的语法，我们使用Python可以很简单的写出一个爬虫程序。本篇博客将以Python语言，用几个非常简单的例子带大家入门Python爬虫。

02

Python 自动化指南（繁琐工作自动化）第二版：十二、网络爬取

由于计算机上的许多工作都涉及到上网，如果你的程序能上网就太好了。网络抓取是使用程序从网络上下载和处理内容的术语。例如，谷歌运行许多网络抓取程序，为其搜索引擎索引网页。在这一章中，你将学习几个模块，这些模块使得用 Python 抓取网页变得很容易。

07

Python爬虫系列：BeautifulSoup库详解

每个人的生命都是通向自我的征途，是对一条道路的尝试，是一条小径的悄然召唤。人们从来都无法以绝对的自我之相存在，每一个人都在努力变成绝对自我，有人迟钝，有人更洞明，但无一不是自己的方式。人人都背负着诞生之时的残余，背负着来自原初世界的黏液和蛋壳，直到生命的终点。

03

教你如何编写第一个爬虫

2019年不管是编程语言排行榜还是在互联网行业，Python一直备受争议，到底是Java热门还是Python热门也是一直让人争吵的话题。

02

爬虫0040：数据筛选爬虫处理之结构化数据操作

爬虫程序，主要是运行在网络中进行数据采集的一种计算机程序，正常的一个爬虫采集数据的过程大致如下：

01

[Python从零到壹] 五.网络爬虫之BeautifulSoup基础语法万字详解

BeautifulSoup是一个可以从HTML或XML文件中提取数据的Python扩展库。BeautifulSoup通过合适的转换器实现文档导航、查找、修改文档等。它可以很好的处理不规范标记并生成剖析树（Parse Tree）；它提供的导航功能（Navigating），可以简单又快速地搜索剖析树以及修改剖析树。BeautifulSoup技术通常用来分析网页结构，抓取相应的Web文档，对于不规则的HTML文档，它提供了一定的补全功能，从而节省了开发者的时间和精力。本章将带领您走进BeautifulSoup爬虫的海洋，下面先简单介绍BeautifulSoup技术的安装过程。

00

美女老师带你做爬虫：BeautifuSoup库详解及实战！

模块：urllib、urllib2、BeautifuSoup4模块（解析器lxml、html）

01

Python 页面解析：Beautiful Soup库的使用

✅作者简介：人工智能专业本科在读，喜欢计算机与编程，写博客记录自己的学习历程。 🍎个人主页：小嗷犬的博客 🍊个人信条：为天地立心，为生民立命，为往圣继绝学，为万世开太平。 🥭本文内容：Python 页面解析：Beautiful Soup库的使用 ---- Python 页面解析：Beautiful Soup库的使用 1.Beautiful Soup库简介 2.Beautiful Soup库方法介绍 2.1 find_all() 2.2 find() 2.3 select() 3.代码实例 --

02

Python爬虫基础教学(写给入门的新手)

本文着重点在于教新手如何学习爬虫，并且会以外行人的思维进行形象地讲解。最近我一兄弟想学，我就想写个教学给他，然后想不如分享到网络上，给热爱学习的人们一起学习探讨。

02

[极客大挑战2019]babysql1题解

在做题页面输入账号为admin，密码随便输入一个，提示密码错误。此外username和password竟然用get方法传输，我很意外，不过倒是方便了测试。

01

04.BeautifulSoup使用

例1: print(type(p.contents)) #list print(p.contents) #可通过索引获取它的某一个元素。

03

精品教学案例 | 基于Python3的证券之星数据爬取

本案例适合作为大数据专业数据采集课程的配套教学案例。通过本案例，能够达到以下教学效果：

03

python_爬虫基础学习

Beautiful Soup库：解析HTML页面（pycharm中安装bs4即可）

02

BeautifulSoup4用法详解

Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱，通过解析文档为用户提供需要抓取的数据，因为简单，所以不需要多少代码就可以写出一个完整的应用程序。

02

BeautifulSoup库整理

注意:如果是html的父标签就是他自己,soup本身也是种特殊的标签的他的父标签是空

02

Python 自动化指南（繁琐工作自动化）第二版：十七、计时、安排任务和启动程序

通过使用subprocess和threading模块，您还可以编写按计划启动其他程序的程序。通常，最快的编程方式是利用他人已经编写的应用。

02

Python：基础&爬虫

Python的一些內建异常： | 异常 | 描述 | | —————– | —————————- | | Exception | 常规错误的基类 | | AttributeError | 对象没有这个属性 | | IOError | 输入/输出操作失败 | | IndexError | 序列中没有此索引(index) | | KeyError | 映射中没有这个键 | | NameError | 未声明/初始化对象 (没有属性) | | SyntaxError | Python 语法错误 | | TypeError | 对类型无效的操作 | | ValueError | 传入无效的参数 | | ZeroDivisionError | 除(或取模)零 (所有数据类型) | 更多可以参考：http://blog.csdn.net/gavin_john/article/details/50738323

01

Python网络爬虫与信息提取

需要注意的是，淘宝网站本身有反爬虫机制，所以在使用requests库的get()方法爬取网页信息时，需要加入本地的cookie信息，否则淘宝返回的是一个错误页面，无法获取数据。

01

Beautiful Soup (一）

1、Beautiful Soup库可以说是对HTML进行解析、遍历、维护“标签树”的功能库

03

BeautifulSoup的基本使用

注意事项：创建soup对象时如果不传’lxml’或者features="lxml"会出现以下警告

02

快速入门网络爬虫系列 Chapter09 | JSON数据处理

JSON是指JavaScript对象表示法(JavaScript Object Notation)：

02

python 爬虫2

一、认识爬虫 1.1、什么是爬虫？爬虫：一段自动抓取互联网信息的程序，从互联网上抓取对于我们有价值的信息。 1.2、Python爬虫架构调度器：相当于一台电脑的CPU，主要负责调度URL管理器、下载器、解析器之间的协调工作。 URL管理器：包括待爬取的URL地址和已爬取的URL地址，防止重复抓取URL和循环抓取URL，实现URL管理器主要用三种方式，通过内存、数据库、缓存数据库来实现。网页下载器：通过传入一个URL地址来下载网页，将网页转换成一个字符串，网页下载器有urllib2（Python官方基础模块）包括需要登录、代理、和cookie，requests(第三方包) 网页解析器：将一个网页字符串进行解析，可以按照我们的要求来提取出我们有用的信息，也可以根据DOM树的解析方式来解析。网页解析器有正则表达式（直观，将网页转成字符串通过模糊匹配的方式来提取有价值的信息，当文档比较复杂的时候，该方法提取数据的时候就会非常的困难）、html.parser（Python自带的）、beautifulsoup（第三方插件，可以使用Python自带的html.parser进行解析，也可以使用lxml进行解析，相对于其他几种来说要强大一些）、lxml（第三方插件，可以解析 xml 和 HTML），html.parser 和 beautifulsoup 以及 lxml 都是以 DOM 树的方式进行解析的。应用程序：就是从网页中提取的有用数据组成的一个应用。

04

信息标记

soup.find_all(…)等价于soup(…) .find_all(…)等价于(…)

01

Python爬虫入门

调度器：相当于一台电脑的CPU，主要负责调度URL管理器、下载器、解析器之间的协调工作。 URL管理器：包括待爬取的URL地址和已爬取的URL地址，防止重复抓取URL和循环抓取URL，实现URL管理器主要用三种方式，通过内存、数据库、缓存数据库来实现。网页下载器：通过传入一个URL地址来下载网页，将网页转换成一个字符串，网页下载器有urllib2（Python官方基础模块）包括需要登录、代理、和cookie，requests(第三方包) 网页解析器：将一个网页字符串进行解析，可以按照我们的要求来提取出我们有用的信息，也可以根据DOM树的解析方式来解析。网页解析器有正则表达式（直观，将网页转成字符串通过模糊匹配的方式来提取有价值的信息，当文档比较复杂的时候，该方法提取数据的时候就会非常的困难）、html.parser（Python自带的）、beautifulsoup（第三方插件，可以使用Python自带的html.parser进行解析，也可以使用lxml进行解析，相对于其他几种来说要强大一些）、lxml（第三方插件，可以解析 xml 和 HTML），html.parser 和 beautifulsoup 以及 lxml 都是以 DOM 树的方式进行解析的。应用程序：就是从网页中提取的有用数据组成的一个应用。

02

BeautifulSoup库

注意:如果是html的父标签就是他自己,soup本身也是种特殊的标签的他的父标签是空

04

Python：bs4中 string 属性和 text 属性的区别及背后的原理

刚开始接触 bs4 的时候，我也很迷茫，觉得 string 属性和 text 属性是一样的，不明白为什么要分成两个属性。

03

python爬虫（三）数据解析，使用bs4工具

和 lxml 一样，Beautiful Soup 也是一个HTML/XML的解析器，主要的功能也是如何解析和提取 HTML/XML 数据。 lxml 只会局部遍历，而Beautiful Soup 是基于HTML DOM（Document Object Model）的，会载入整个文档，解析整个DOM树，因此时间和内存开销都会大很多，所以性能要低于lxml。 BeautifulSoup 用来解析 HTML 比较简单，API非常人性化，支持CSS选择器、Python标准库中的HTML解析器，也支持 lxml 的 XML解析器。 Beautiful Soup 3 目前已经停止开发，推荐现在的项目使用Beautiful Soup 4。

01

JS日期方法操作大全，看这篇就够了

译者：前端小智原文：https://css-tricks.com/everything-you-need-to-know-about-date-in-javascript/

02

Python爬虫

调度器：相当于一台电脑的CPU，主要负责调度URL管理器、下载器、解析器之间的协调工作。 URL管理器：包括待爬取的URL地址和已爬取的URL地址，防止重复抓取URL和循环抓取URL，实现URL管理器主要用三种方式，通过内存、数据库、缓存数据库来实现。网页下载器：通过传入一个URL地址来下载网页，将网页转换成一个字符串，网页下载器有urllib2（Python官方基础模块）包括需要登录、代理、和cookie，requests(第三方包) 网页解析器：将一个网页字符串进行解析，可以按照我们的要求来提取出我们有用的信息，也可以根据DOM树的解析方式来解析。网页解析器有正则表达式（直观，将网页转成字符串通过模糊匹配的方式来提取有价值的信息，当文档比较复杂的时候，该方法提取数据的时候就会非常的困难）、html.parser（Python自带的）、beautifulsoup（第三方插件，可以使用Python自带的html.parser进行解析，也可以使用lxml进行解析，相对于其他几种来说要强大一些）、lxml（第三方插件，可以解析 xml 和 HTML），html.parser 和 beautifulsoup 以及 lxml 都是以 DOM 树的方式进行解析的。应用程序：就是从网页中提取的有用数据组成的一个应用。

03

如何用Python快速抓取Google搜索？

自从2011年 Google Web Search API 被弃用以来，我一直在寻找其他的方法来抓取Google。我需要一种方法，让我的 Python 脚本从 Google 搜索中获取链接。于是，我自己想出了一种方法，而本文正是通过 requests 和 Beautiful Soup 抓取 Google 搜索的快速指南。

02

需要知道的JS的日期知识，都在这了

JS中的 Date 很奇怪。当我们需要处理日期和时间的时候比较麻烦，经常借助像date-fns和 Moment 这样的库。

04

第一篇爬虫之初体验

理论学习都是枯燥的，我们学习了初步的网络编程后，再来了解一下爬虫吧，网络爬虫可以极大增强趣味性。

03

Python BS4解析库用法详解

Beautiful Soup 简称 BS4（其中 4 表示版本号）是一个 Python 第三方库，它可以从 HTML 或 XML 文档中快速地提取指定的数据。Beautiful Soup 语法简单，使用方便，并且容易理解，因此您可以快速地学习并掌握它。本节我们讲解 BS4 的基本语法。

04

Python数据科学（七）- 资料清理(Ⅱ)1.资料转换2.处理时间格式资料3.重塑资料4.学习正则表达式5.实例处理

注意：这里的时间转换后的格式可以根据需要设定，eg：dt.strftime('%Y/%m/%d')

03

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭