我可以将beautifulsoup中的两个'findAll'搜索块合并为一个吗？ - 腾讯云开发者社区

文章/答案/技术大牛

发布

4回答

我可以把两个'findAll‘搜索块组合在一个漂亮的汤里吗？

、

我是否可以将这两个块合并为一个： tag.extract() 还可以<e

浏览 1提问于2009-12-01得票数 2

回答已采纳

1回答

使用Python和Mechanize的随机形式的FIlling

、、、、

我正在尝试使用机械化自动登录一个网站，并检查一些数字。我很确定我已经通过了通常的用户名密码表单的第一个页面，但第二个登录页面要求您在帐户创建过程中选择的安全问题的答案中的特定字符。例如，如果你最喜欢的宠物叫加菲猫，它要求输入第二个、第四个和第五个字符，你必须填写3个输入a，f，i，并张贴表格。我不确定让机械化搜索它每次登录时想要的</e

浏览 0提问于2013-06-30得票数 1

回答已采纳

1回答

漂亮的Soup 4 HTML文档目录

、

BS4解析计算机上某个目录中的多个HTML文档。我的目标是找到以“ix:NonFraction.”开头的标签。包含一个名称属性，可以在'AuditFeesExpenses‘之前有几个表达式，比如name=“name=：AuditFeesExpenses、name=bus:AuditFeesExpenses”等等因此，如果BS4找到了特定的标记，我想用soup.get_text(Value)从其中提取文本。有人知道我

浏览 3提问于2016-05-10得票数 1

回答已采纳

2回答

findall只返回最后一个属性

、、

我曾寻找过类似的问题，但没有找到我需要的。我在web中搜索两个属性--本例中为red和span中的greenfrom bs4 import BeautifulSoupnameList=soup.findAll("span",{"class":"red&q

浏览 0提问于2018-11-23得票数 0

回答已采纳

2回答

使用Python-BeautifulSoup抓取表格数据

、、

我不知道如何抓取第一个表数据，而不是两个。<tr></td></td></tr>import requests from bs4 import BeautifulSou

浏览 11提问于2017-08-17得票数 0

回答已采纳

4回答

解析html标签，基于类和href标签，使用漂亮的soup

、

我正在尝试用BeautifulSoup解析超文本标记语言。我想要的内容如下：我尝试了一下，得到了以下错误： maxx = soup.findAll

浏览 0提问于2011-09-23得票数 3

回答已采纳

13回答

美汤与按ID抽取div及其内容

、

</div>标签和中间的东西呢？它不返回任何内容。我知道它确实存在，因为我从soup.find("div", { "id" : "articlebody" })也不起作用。(编辑：我发现BeautifulSoup没有正确解析我的页面，这可能意味着我试图解析的页面格式不正确。)

浏览 65提问于2010-01-26得票数 188

回答已采纳

2回答

在<b>和<strong>标记之间提取文本的正则表达式

、

我需要在python中使用regex来提取和标记之间的文本。为此，我正在做以下工作： text=re.f

浏览 2提问于2018-10-11得票数 0

2回答

Python:打印特定href中的数据(带有ID标签)

、、

我是Python的新手，正在尝试构建我的第一个网络摩天大楼。我想转到一个页面，打开一系列子页面，在页面上找到一个特定的链接(带有ID)，然后打印链接数据。现在我得到了错误：‘列表索引必须是整数，而不是str'，这意味着我在(至少)最后一行代码中做了一些错误的事情。我真正不确定的是，我需要做什么来抓取和

浏览 2提问于2012-07-30得票数 0

2回答

通过python从响应数据中检索特定数据

、、

我正在接收来自web服务的数据，它以html form.The响应数据格式回复我的数据是这个下拉列表： </span> 我需要进一步处理这些数据

浏览 0提问于2012-01-26得票数 2

回答已采纳

2回答

toiIgnore utf-8在网页抓取数据中的应用

、、、

我正在使用漂亮汤网刮prayerprofiler.com。但是，数据是utf-8编码，我无法处理。每当我打印数据时，我都会得到错误信息。: 'charmap' codec can't encode character '\u2605' in position 184621: character maps to <undefined> 我可以用column_headers_row = stats_page.findAll(&#x

浏览 1提问于2021-08-19得票数 0

回答已采纳

4回答

如果对象也有其他类，Beautiful找不到CSS类

、、

如果一个页面有<div class="class1">和<p class="class1">，那么soup.findAll(True, 'class1')会同时找到它们。如何找到具有某个类的所有对象，而不管它们是否也有其他类？

浏览 2提问于2009-08-07得票数 40

回答已采纳

2回答

如何使用查找'<v:imagedata r:id="rId7“o:title="1-REN"/>‘

、、、

我试图用名称空间<v:imagedata r:id="rId7" o:title="1-REN"/>从Word文档中查找所有内容，但我不知道语法到底是什么。只覆盖非常直接的情况，加上URN和VML组合，我似乎无法获得我在网上看到的任何示例。有没有人碰巧知道这是什么？我想做这样的事： namespace = {'v': "urn:schemas-microsoft

浏览 11提问于2020-05-31得票数 5

回答已采纳

1回答

从不同的HTML表中提取数据

、、

我正在尝试从Edgar数据库()的8-K表单的损益表中提取数据。下面是一些示例：我想要清理的表格被称为“经营报表”或“收入报表”或类似的表格。我尝试提取所有数据(如净销售额、营业收入等)。并根据日期和时间间隔(三个月、六个月等)将其放入字典中。问题是表格结构的高度多样性--有很多方法可以构建这样的数据。我创建了一个使用Beautiful Soup解析表的脚本

浏览 0提问于2012-10-30得票数 1

1回答

Python BeautifulSoup4 WebCrawler .findAll()不解析

、、、

我正在尝试制作一个python刮刀来从零售网站中提取所有的产品名称。以下是网站中“检查元素”代码的一部分，供您参考：不幸的是，上面的代码块并没有产生任何结果！当我尝试引用<main>部分中的条目时，问题似乎就出现了--在引用行之前，我会得到结果。理想情况下，我可以在网页上提取每个项目的名称(请参阅网站代码的另一张快照，以了解网站中的相关行)。这些行

浏览 0提问于2018-03-24得票数 0

回答已采纳

4回答

使用BeautifulSoup搜索HTML中的字符串

、

我使用BeautifulSoup在特定页面上查找用户输入的字符串。例如，我想看看字符串'Python‘是否位于页面上：但是当我使用：find_string = soup.body.findAll(text=re.compile('Python'), limit=1)时，find_string像预期<e

浏览 1提问于2012-01-20得票数 67

回答已采纳

2回答

如果findAll没有争论，它会做什么？

、

我正在尝试理解python代码。它有一份声明其中soup是Beautifulsoup object类型：<class 'bs4.element.ResultSet'>findAll与这里的匹配是什么？

浏览 2提问于2015-04-05得票数 0

回答已采纳

1回答

用Python解析HTML页面时出错

、

我试图在代码为"SEVNYXX“的列下获取数据，其中"XX”是后面的数字(例如。01，02等)在网站上使用Python。我目前正在按照网站的规定使用以下方法。但是，我不知道如何确定这个页面的div，因此无法继续下去，我希望在这方面得到一些帮助。到目前为止，这就是我所拥有的：import requests page = requests.get('http://www.fede

浏览 4提问于2015-06-09得票数 0

回答已采纳

2回答

用漂亮的汤刮页

、、

我有两个稍微不同的urls：，in[1]= soup.findAll('span', class_='property__base-info__value')[1].text.strip() out[1]= u'3 800 000 kr

浏览 3提问于2017-03-22得票数 1

回答已采纳

1回答

将urllib2 2/漂亮汤请求划分为更小的请求包

、、

我想收集一组关于搜索术语“汽车”的专利I。我写了这段代码：from bs4 import BeautifulSoupimport StringIO patent_list.append(split_link[-1]) 然而，我得到了

浏览 0提问于2018-04-20得票数 1

回答已采纳

点击加载更多

我可以把两个'findAll‘搜索块组合在一个漂亮的汤里吗？

使用Python和Mechanize的随机形式的FIlling

漂亮的Soup 4 HTML文档目录

findall只返回最后一个属性

使用Python-BeautifulSoup抓取表格数据

解析html标签，基于类和href标签，使用漂亮的soup

美汤与按ID抽取div及其内容

在<b>和<strong>标记之间提取文本的正则表达式

Python:打印特定href中的数据(带有ID标签)

通过python从响应数据中检索特定数据

toiIgnore utf-8在网页抓取数据中的应用

如果对象也有其他类，Beautiful找不到CSS类

如何使用查找'<v:imagedata r:id="rId7“o:title="1-REN"/>‘

从不同的HTML表中提取数据

Python BeautifulSoup4 WebCrawler .findAll()不解析

使用BeautifulSoup搜索HTML中的字符串

如果findAll没有争论，它会做什么？

用Python解析HTML页面时出错

用漂亮的汤刮页

将urllib2 2/漂亮汤请求划分为更小的请求包

相关资讯

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐