如何对包含破折号的属性使用SoupStrainer？

对于包含破折号的属性，可以使用BeautifulSoup库中的SoupStrainer来进行筛选和解析。SoupStrainer是一个用于过滤HTML或XML文档的类，可以根据特定的标签、属性或文本内容来筛选需要的部分。

使用SoupStrainer来处理包含破折号的属性，可以按照以下步骤进行：

导入BeautifulSoup库和SoupStrainer类：

from bs4 import BeautifulSoup, SoupStrainer

创建一个SoupStrainer对象，并指定需要筛选的标签和属性：

strainer = SoupStrainer('tag', attrs={'attribute': 'value'})

其中，'tag'是需要筛选的标签名称，'attribute'是需要筛选的属性名称，'value'是属性的具体值。可以根据实际情况进行修改。

使用SoupStrainer对象解析HTML或XML文档：

with open('example.html') as file:
    soup = BeautifulSoup(file, 'html.parser', parse_only=strainer)

其中，'example.html'是待解析的HTML文件路径，'html.parser'是解析器的类型，可以根据实际情况选择其他解析器。

对解析后的文档进行操作，如提取需要的内容：

result = soup.find('tag', attrs={'attribute': 'value'})

其中，'tag'是需要提取的标签名称，'attribute'是需要提取的属性名称，'value'是属性的具体值。可以根据实际情况进行修改。

关于SoupStrainer的更多详细信息和用法，可以参考腾讯云的BeautifulSoup文档：BeautifulSoup文档。

请注意，以上答案仅供参考，具体的实现方式可能会因实际情况而有所不同。

如何对包含破折号的属性使用SoupStrainer？

、、、、

我使用的是Django和Python 3.7。我想使用BeautifulSoup和SoupStrainer在文档中查找具有属性的特定元素。但是如果属性中包含破折号，我该怎么做呢？我想这么做 my_strainer = SoupStrainer('a', data-id="aaa") 但这会导致错误 Can't assign to function call 抱怨&qu

浏览 21提问于2019-02-23得票数 1

回答已采纳

1回答

漂亮的汤和过滤器，让链接不起作用，哈扎特，还总是正确的

、、、、

我正在使用Python3.3中的Beautifulsoup4和Soupstrainer来获取网页上的所有链接。以下是重要的代码片段：for link in BeautifulSoup(r.text, parse_only=SoupStrainer正因为如此，我在使用链接‘’href‘的时候遇到了麻烦，因为它根本不存在。, parse_only=SoupStra

浏览 4提问于2013-07-30得票数 1

回答已采纳

3回答

SoupStrainer可以有两个参数吗？

、、

我在stackoverflow或Google上找不到这样的问题，所以我还是会把它贴出来，以帮助任何偶然发现它的人。我想使用BeautifulSoup中的SoupStrainer来解析两个标记，而不是html文档中的一个。我知道我能做到：这将获得<p>标记。所以我试了一下： soup =

浏览 4提问于2014-12-31得票数 4

2回答

python中的网站抓取，但是这个类有一个不同的类名。(discord.py也是)

、、、、

我试着抓取"flashscore.com“的匹配细节，例如"https://www.flashscore.com/match/hEyZ9RHu/#match-summary"，然后在discord上的嵌入中重用它们基本上所有这些都是通过discord机器人完成的，但现在这并不重要。我试图获得一个人的全名，但它似乎不起作用。”name=soup.find_all('a', class_=re.compile("par

浏览 21提问于2021-02-01得票数 1

1回答

使用SoupStrainer和BeautifulSoup获取具有多个属性的所有标签

、

当class属性有几个不同的值时，我试图获得'td‘标记的所有匹配项。事后我知道如何使用BeautifulSoup完成此操作，但由于所需的时间较长，我试图通过使用SoupStrainer选择性地解析每个页面来加快速度。我最初尝试了下面的方法，但似乎不起作用。strainer = SoupStrainer('td', attrs={'class': ['Value_One&#x

浏览 0提问于2017-07-18得票数 0

1回答

使用httplib2和BeautifulSoup递归搜索网站的链接

、、

我使用以下方法从网页中获取所有外部Javascript引用。我如何修改代码，以便不仅搜索网址，而且搜索网站的所有页面？import httplib2status,response = http.request('https://stackoverflow.com') for link in BeautifulSoup(resp

浏览 5提问于2017-10-02得票数 0

1回答

find_all()函数和BeautifulSoup包的SoupStrainer有什么区别？

、

以下代码用于在屏幕上打印html_doc的标签，它是一个包含html代码的变量：下面的代码返回相同的结果： print(BeautifulSoup(html_do

浏览 1提问于2017-11-10得票数 1

1回答

使用SoupStrainer与lambda表达式

、、

给定具有三个a标记的以下html：<html><head><title>The Dormouse's story</title></head><p class</p>我想要创建一个SoupStrainer实例，该实例将html_doc缩进，过滤a属性包含‘lister__ cla

浏览 5提问于2017-09-14得票数 0

回答已采纳

5回答

使用Python和BeautifulSoup基于属性解析a标记

、、、、

使用这部分html： <a class="playerLink" href="http://bbroto.baseball.cbssports.com但是，我还没有弄清楚如何使用BeautifulSoup引用Python循环中的子选项卡。以下是我的尝试： pl = soup.fin

浏览 0提问于2013-12-06得票数 2

回答已采纳

1回答

用SoupStrainer解析注释

、、

如何使用SoupStrainer解析注释？ and 'line_score' in text)我真的不知道从哪里开始，因为我知道

浏览 1提问于2021-09-16得票数 0

1回答

BeautifulSoup意外匹配<!doctype>

、

我有一些简单的密码..。下面是我发现的一种过滤方法：... continue 仍然感兴趣的是如何避免

浏览 1提问于2017-09-15得票数 2

1回答

如何检索在Swift中具有破折号的JSON属性？

、、、

我在Swift中遇到了一个没有找到解决方案的问题:当您在Swift中解码JSON数据(来自API)时，您必须使用JSONDecoder对其进行解码，但这迫使我将变量名命名为与我想要检索的JSON属性完全相同的JSON属性--问题是，JSON-属性的名称中包含一个破折号(“饱和-fat_100g”)。当然，由于破折号的缘故，我不能把我的变量叫做那样

浏览 7提问于2022-08-11得票数 -1

2回答

如何静态地声明Javascript对象实例(即.一个“关联数组”)，其属性名(即.a键)包含破折号？

、、、

我想静态地声明Javascript对象(在使用时有时被称为“关联数组”)，其属性名(“key”)包含破折号？无破折号(工程)：使用破折号(结果导致语法错误)：(是的，我完全知道包含破折号</e

浏览 4提问于2016-11-05得票数 1

回答已采纳

1回答

美丽的汤过滤器只从特定的容器中过滤物品

、、

“订单卡”的代码。目标是，“page_soup”只包含“容器-01”中的所有“订单卡”项目。上面的重新措辞！的目标是从“容器-01”中的每一张“商品卡”中获取细节。除了“容器-01”之外，不需要解析任何其他容器。only_item_cells = SoupStrainer('div', attrs={"

浏览 1提问于2021-12-22得票数 0

回答已采纳

2回答

参数传递函数

、、、

在Python出现的几年中，似乎已经解决了这个问题，但无论如何，这里是这样的： ''' take a soup element', 'r') as the_file:result = soupstrainer<

浏览 3提问于2022-01-20得票数 0

1回答

用于打印包含特定单词的web链接的Python程序不会输出任何内容

、、、、

我想打印出包含特定关键字(比如“特斯拉”)的新闻文章的网络链接。因此，我在Google新闻主页上搜索单词"tesla“，并编写了以下代码来搜索其中包含单词"Tesla”的文章(这应该是所有文章，因为它在一组肯定包含单词的文章中搜索单词)：status, respons

浏览 0提问于2018-05-21得票数 0

1回答

VIM关键字-使用破折号(-)作为分隔符，但在property标识符/函数调用(->)中不使用

我在一起使用CSS和PHP，惯例是在CSS中用破折号分隔(例如，‘这个是一个类名称’)。我增加了使用vimrc来加速导航和替换，这在CSS中非常有用，但是现在'cw'/'dw‘将在PHP中任何对属性/函数调用的调用中杀死破折号。显然，从VIM的角度来看，这是在发挥作用，因此问题是：是否有一个正则表达式会导致 Is关键字包含破折号，

浏览 7提问于2017-06-19得票数 0

2回答

无法过滤图像的美化效果

、

我试图获取网页上图像的URL，并使用以下代码：from BeautifulSoup import BeautifulSoup, SoupStrainer print "IMAGE PATH: "+link['src'] 我想过滤到看不见的图像的链接编辑:谢谢梁振英，我试过使用你给

浏览 1提问于2017-04-25得票数 0

回答已采纳

1回答

对于包含多个单词的html5数据标记，正确的命名约定是什么？

、

html5中的自定义数据属性是由data -customdataname指定的；一般来说，我总是用破折号分隔包含多个单词的html元素(例如，class="foo-bar")。然而，由于数据标记已经需要在其中添加破折号，因此在这里执行同样的操作似乎非常不切实际。我还知道在html名称中通常不使用CamelCase。如何使用多个单词命名数据标记？

浏览 0提问于2013-07-06得票数 3

回答已采纳

1回答

如果名称包含-，则无法使用JAXB解析xml

我正在使用JAXB注解来解析由testNG生成的test-results.xml。我可以使用@XmlAttribute(name="someName")提取任何属性，但是JAXB不能使用- (如@XmlAttribute(name="some-name"))读取属性我该怎么做呢？

浏览 1提问于2012-10-08得票数 4

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何对包含破折号的属性使用SoupStrainer？

相关·内容

如何对包含破折号的属性使用SoupStrainer？

漂亮的汤和过滤器，让链接不起作用，哈扎特，还总是正确的

SoupStrainer可以有两个参数吗？

python中的网站抓取，但是这个类有一个不同的类名。(discord.py也是)

使用SoupStrainer和BeautifulSoup获取具有多个属性的所有标签

使用httplib2和BeautifulSoup递归搜索网站的链接

find_all()函数和BeautifulSoup包的SoupStrainer有什么区别？

使用SoupStrainer与lambda表达式

使用Python和BeautifulSoup基于属性解析a标记

用SoupStrainer解析注释

BeautifulSoup意外匹配<!doctype>

如何检索在Swift中具有破折号的JSON属性？

如何静态地声明Javascript对象实例(即.一个“关联数组”)，其属性名(即.a键)包含破折号？

美丽的汤过滤器只从特定的容器中过滤物品

参数传递函数

用于打印包含特定单词的web链接的Python程序不会输出任何内容

VIM关键字-使用破折号(-)作为分隔符，但在property标识符/函数调用(->)中不使用

无法过滤图像的美化效果

对于包含多个单词的html5数据标记，正确的命名约定是什么？

如果名称包含-，则无法使用JAXB解析xml

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐