BeautifulSoup找不到包含某些文本的HTML标记

、、

我只想使用正则表达式来检索HTML中包含"//“的所有元素，然后根据这个问题得到答案：from BeautifulSoup import BeautifulSoup""" <!stylesheet" href="//abc.com/xyz&q

浏览 3提问于2017-07-06得票数 0

回答已采纳

1回答

如何动态地找到所选元素的最近的特定父级？

、、、

我希望解析许多html页面，并使用beautifulsoup html.parser和python删除包含文本"Message“的div。div没有名称或id，因此指向它是不可能的。这是因为在这个html页面中，div标记和文本"Message“之间有5个标记(p，i，b，span，a)，第6个标记是div。下面的代码适用于1 html页面。s

浏览 8提问于2022-11-30得票数 2

回答已采纳

1回答

BeautifulStoneSoup -如何取消转义并添加结束标记

我在这里编辑原始帖子是为了澄清，希望我已经把它简化成更容易管理的东西。>所以，我正在做一些类似的事情：images = xm

浏览 2提问于2011-09-24得票数 1

1回答

我在使用以下页面上包含的文本查找标记时遇到了问题：Link to web page 我正在尝试使用以下代码查找彭博社和路透社的代码。my_soup.find(lambda t: t.Tag == 'td' and re.findall('Bloomberg Code', t.text, flags=re.I)) 它们都返回了大量的Html代码，这些代码都以标记"tr“开头，但并不符合我的</em

浏览 16提问于2019-09-20得票数 0

回答已采纳

1回答

BeautifulSoup无法访问<text>标记的内容

、、、、

我使用BeautifulSoup (版本4.4)对来自的维基百科文本转储进行预处理，以便进行进一步的解析。 textdump文档包含多个文章，每个文章包含在一个<page>标记中。不幸的是，关于文档结构的某些内容似乎与BeautifulSoup不兼容:在每个<page>中，文章的文本正文包含在<text>块中：

浏览 0提问于2018-08-29得票数 1

回答已采纳

2回答

如何使用Python提取xml文档中的标记偏移量

、、、

我需要帮助查找XML文档中某些标记的文本偏移量。我有一个数据集，它遵循下面所示的格式，其中根元素包含几个记录，尽管每个记录只包含一个文本元素。在文本中，可能存在几个标记元素，用作某些文本的注释。我需要将这些注释转换为另一种格式，需要使用Python对标记进行开始和结束偏移。</TEXT> <TAG TY

浏览 5提问于2014-12-29得票数 1

回答已采纳

1回答

当元素确实存在时，BeautifulSoup返回'None‘

、

首先，如果我错过了一些非常简单的东西，我道歉，我已经看了很多问题，但终生都找不到答案。基本上，我试图收集文本的网站是这样的： url = 'https://www.otcmarkets.com/stock/MNGG/overview'soup = Be

浏览 34提问于2021-02-27得票数 0

3回答

从HTML中读取头内容

、、

我需要在python的小脚本。需要读取web文件中的自定义块。the_page = response.read()# <<em

浏览 1提问于2010-12-20得票数 2

回答已采纳

2回答

获取标记中的所有文本，除非它位于另一个标记中。

、、

我试图用BeautifulSoup解析一些HTML，我想将所有的文本(递归地)都放在一个标记中，但是我想忽略small标记中出现的所有文本。例如，这个HTML： <a href="/path"> </a> <small><&

浏览 4提问于2016-11-06得票数 0

回答已采纳

2回答

使用BeautifulSoup拆分HTML文档

、、

我们处理长聚合的HTML文档(用于转换为PDF)。在某些情况下，聚合的超文本标记语言文档必须按章节(以H1标记开头的专用超文本标记语言页面)或子章(以每个H1或H2标记开头的专用超文本标记语言页面)拆分。到目前为止，我们使用BeautifulSoup来操作聚合的超文本标记语言

浏览 2提问于2011-02-24得票数 4

回答已采纳

1回答

注释在网页上可见，但BeautifulSoup返回的html对象不包含注释部分

、、、

我尝试使用网址链接从网页中提取评论的文本内容，并使用BeautifulSoup进行抓取。当我单击URL链接时，在页面上可以看到注释的内容，但是BeautifulSoup返回的HTML对象不包含这些标记和文本。我使用带有'html.parser‘的BeautifulSoup来做网页抓取。我成功地提取了给定网页中视频的点赞/浏览

浏览 19提问于2019-03-25得票数 1

回答已采纳

4回答

Python:将HTML代码段分隔为段落

、、、

我有一个包含段落的HTML片段。(我指的是p标记。)我想把字符串分成不同的段落。例如：<p class="my_class">Hello!</p> <p>What's up?

浏览 0提问于2010-02-17得票数 3

回答已采纳

1回答

python3汤，替换html元素内容并保存到文件

、

如何替换文件中html标签的文本内容并将其保存到另一个(某些)文件中？<!DOCTYPE html> <head> <body> </

浏览 363提问于2018-06-19得票数 1

回答已采纳

1回答

如何通过Python BeautifulSoup中的特定文本找到标记？

、、、

您知道如何在pythons BeautifulSoup中搜索特定的文本吗?查找标记？？更好的标记完整路径，包含一些string。例如，BS4的常用用法是：from bs4 import BeautifulSoup website = requests.get(ur

浏览 4提问于2022-09-04得票数 0

回答已采纳

7回答

BeautifulSoup解析的问题

、

我正在尝试用BeautifulSoup解析一个html页面，但是看起来BeautifulSoup根本不喜欢这个html或者那个页面。"-- HTML ------------------------------------------"print "-- BeautifulSoup ---------------------------------" print BeautifulSoup

浏览 1提问于2009-03-02得票数 5

回答已采纳

3回答

查找文本，但跳过其他元素

、、

目前，我试图从'td‘元素中提取文本，但是其中有更多的元素。所以find()返回td标记中的整个文本。>some more text</a> <br>所以我想要的只是td标签之后的下一个。我正在使用

浏览 5提问于2016-06-07得票数 0

回答已采纳

1回答

我如何使用python中的漂亮汤来替换多个单词(术语)，包括html标签？

、、、

我尝试在html文件中查找和替换术语(带有链接)，但我喜欢保留另一个html结构。首先，我尝试使用string查找标记，但是由于子标记，字符串不包含所有文本，用修改后的字符串替换它将删除所有子标记。最后，我使用__str__()方法获取每个段落的内容，以获取所有html内容，并用新的BeautifulSoup对象替换它(以包含其中的所有标

浏览 18提问于2019-01-24得票数 0

2回答

是否有一个选择器可以用来选择没有标记的元素(在Python中)？

、、

我尝试使用基本的Python选择器来获取文本，但我无法解决。我主要想知道是否有一个选择器可以通过Beautiful select()方法来选择<div>中的元素，而不是<table>中的元素。我对HMTL知之甚少，所以我对上述代码示例中的任何错误或混淆表示歉意。

浏览 3提问于2020-03-31得票数 0

回答已采纳

1回答

在Python中使用Beautifulsoup解析html表格

、

我正在尝试从大量的html页面中解析表格。/">D2</a></td> </tr> 行数因页而异，因此解析器应该能够处理任意数量的行。我想从每个html页面收集信息，比如B1 B2 B3D1 D2 D3 我该怎么做呢？

浏览 0提问于2017-08-23得票数 1

回答已采纳

1回答

BeautifulSoup结果中的Regex不匹配模式

、、、

我试图解析一些HTML以查找RegEx。当我使用在线工具验证我的regex表达式时，它会正常工作。它找到了价值。但是，当我将BeautifulSoup与RegEx结合使用时，模式无法找到表达式。下面是我正在使用的Python脚本。我用过几个这样的问题，包括这个，但是没有成功。如果我使用soup = BeautifulSoup(fp, 'html.parser').find_all(string=PATTERN)，那么脚本的全文已经存

浏览 3提问于2021-08-20得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何动态地找到所选元素的最近的特定父级？

BeautifulStoneSoup -如何取消转义并添加结束标记

BeautifulSoup:找不到包含文本的标记

BeautifulSoup无法访问<text>标记的内容

如何使用Python提取xml文档中的标记偏移量

当元素确实存在时，BeautifulSoup返回'None‘

从HTML中读取头内容

获取标记中的所有文本，除非它位于另一个标记中。

使用BeautifulSoup拆分HTML文档

注释在网页上可见，但BeautifulSoup返回的html对象不包含注释部分

Python:将HTML代码段分隔为段落

python3汤，替换html元素内容并保存到文件

如何通过Python BeautifulSoup中的特定文本找到标记？

BeautifulSoup解析的问题

查找文本，但跳过其他元素

我如何使用python中的漂亮汤来替换多个单词(术语)，包括html标签？

是否有一个选择器可以用来选择没有标记的元素(在Python中)？

在Python中使用Beautifulsoup解析html表格

BeautifulSoup结果中的Regex不匹配模式

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐