Beautiful Soup find_all()返回有序列表吗？

Beautiful Soup 是一个 Python 库，用于从 HTML 和 XML 文件中提取数据。它创建了一个解析树，从中可以方便地查找和导航文档。

find_all() 方法是 Beautiful Soup 中的一个非常有用的方法，它用于搜索当前标签的所有匹配子标签。这个方法返回的是一个列表，包含了所有匹配的元素。

关于你的问题，find_all() 返回的列表是否有序：

一般来说，find_all() 返回的列表是有序的，它会按照它们在源文档中出现的顺序来排列。
但是，这个顺序可能会受到一些因素的影响，比如 HTML 文档的结构、标签的嵌套等。

示例代码：

from bs4 import BeautifulSoup

html_doc = """
<html>
<head><title>Page Title</title></head>
<body>
<div class="container">
    <p>First paragraph.</p>
    <p>Second paragraph.</p>
</div>
</body>
</html>
"""

soup = BeautifulSoup(html_doc, 'html.parser')
paragraphs = soup.find_all('p')

for p in paragraphs:
    print(p.get_text())

输出：

First paragraph.
Second paragraph.

在这个例子中，find_all('p') 返回了一个包含两个 <p> 标签的列表，这两个标签是按照它们在 HTML 文档中出现的顺序排列的。

参考链接： Beautiful Soup 官方文档

如果你在使用 find_all() 时遇到了问题，比如返回的列表顺序不符合预期，可能的原因包括：

HTML 文档的结构发生了变化。
有多个相同的标签，它们的顺序在文档中被改变了。
使用了某些特定的解析器，导致解析结果有所不同。

解决方法：

确保 HTML 文档的结构是正确的。
检查是否有其他代码修改了 Beautiful Soup 解析树的结构。
尝试使用不同的解析器，比如 html.parser、lxml 或 html5lib，看看是否能解决问题。

如果你需要进一步的帮助或有其他问题，请随时告诉我。

Beautiful Soup find_all()返回有序列表吗？

、、

find_all()方法返回的数据具有bs4.element.ResultSet类，根据我的研究，它是一个列表的子类，所以假设它是一个有序的，但我仍然想要求确保我的假设是正确的，因为我在编程方面非常初级，我不想太相信自己，文档并没有真正说明它是一个有序的，但老实说，我只是扫描了它，而没有完全阅读它。

浏览 51提问于2021-11-19得票数 0

回答已采纳

1回答

从特定标签返回文本

、、

/usr/bin/python3 from bs4 import BeautifulSoup soup = BeautifulSoup(open("test.html")) print(soup(itemprop="name"))[<span itemprop="na

浏览 0提问于2014-08-12得票数 5

回答已采纳

1回答

非类型错误/没有使用python的漂亮汤打印的元素

、、、

所以我尝试使用python比较两个列表，其中一个包含我从网站获取的1000个链接。另一个包含一些单词，这些单词可能包含在第一个列表中的链接中。如果是这样的话，我想得到一个输出。我打印了第一个列表，它确实起作用了。我的代码如下所示： page_source = driver.page_source Bot_Stickers =soup.find_all('img', class_=&

浏览 10提问于2020-11-28得票数 0

回答已采纳

1回答

美汤刮擦表返回的是字符串列表而不是列表列表

、、

使用Beautiful Soup抓取网站是返回字符串列表而不是列表列表。我尝试了一个.replace，但它在循环中不能在列表上工作。urllib.request.urlopen('https://www.basketball-reference.com/players/d/duncati01/gamelog/2015').read() soup= bs.Bea

浏览 19提问于2019-10-05得票数 0

回答已采纳

2回答

美丽的Soup find_all()返回奇怪的标签而不是结果

、、

我正在使用Beautiful从XML文件中获取一些信息，如下所示：<link>example.com/rss</link>[ <link/>, <link/> ] 我似乎在任何文档中都找不到这样的东西

浏览 5提问于2014-10-05得票数 2

回答已采纳

1回答

索引似乎存在时超出范围

、、、

有什么线索能解释为什么吗？vegas_insider = requests.get('https://www.vegasinsider.com/college-football/matchups/', 'r').text closing_line = soup.find('td', class_ = 'viCellB

浏览 17提问于2021-10-17得票数 0

回答已采纳

1回答

使用BeautifulSoup by class抓取返回空列表

、

(附在下面的屏幕截图)与BeautifulSoup，但得到空的列表，而只有锚标签是工作的。我阅读了BeautifulSoup文档，并尝试了select()方法和find_all()方法，但仍然给出了一个空列表。q=beautiful+soup')>>> elems = soup.select(&#

浏览 4提问于2019-09-07得票数 0

1回答

BeautifulSoup在find_all之后获得href

、

我已经创建了一个汤&使用find_all方法隔离了我想要的所有数据。但是，我需要的字符串是在汤中进一步嵌套的。我知道find_all返回一个列表，但我需要进一步提取列表才能得到我所需要的。我对编码世界很陌生，对Python有相当的理解，但对Beautiful只有基本的理解。.) # importing the url I want to work over soup = BeautifulSoup(URL.text, 'html.parser'

浏览 4提问于2017-10-30得票数 1

回答已采纳

2回答

如何使用Beautiful soup从HTML锚标记返回目的地

、

我正在使用python2和Beautiful soup来解析通过requests模块检索到的HTMLfrom bs4 import BeautifulSoup HTML = site.text返回一个包含输出的列表

浏览 0提问于2014-10-10得票数 0

1回答

在python // html中解析数据时遇到问题

、、

链接：我想知道为什么我的第二行代码返回None值。据我所知，In[194]正在沿着[-1]索引"US understand“应用一个函数，查找%符号，然后将s[:-1]中剩余的数值转换为整数。

浏览 0提问于2020-05-07得票数 0

2回答

为什么find_all会给出一个错误，即使在查找中没有错误？(Python美丽汤)

、、、、

url= 'http://www.billboard.com/charts/year-end/2015/hot-100-songs'soup= BeautifulSoup(page.read(), "html.parser") songtitle = soup.find("div", {"class": "row-title"})

浏览 10提问于2015-12-25得票数 3

回答已采纳

1回答

并非所有从Beautifulsoup find_all方法返回的HTML元素

、、

尝试使用Beautiful soup从website.However中提取数据当我使用find_all函数时，我只得到目标元素( li )的一个子集，所以在本例中，不是获得24个li项，而是只返回12个www.tomford.com/beauty/lips/'reqs = requests.get(url,headers) soup= Be

浏览 14提问于2021-03-08得票数 1

回答已采纳

1回答

AttributeError: ResultSet对象没有属性“find_all”

、、、

football/news-2442480-orlov-zenit-obespokoen---pole-na-novom-stadione-mozhet-byt-nekachestvennym.html") soup=soup.find_all('div', class_="text-decor article__contain")invalid_tags = ['b&#x

浏览 1提问于2016-04-22得票数 0

回答已采纳

2回答

BeautifulSoup -在多个‘表’上使用find_all时的AttributeError

、、

line 2160, in __getattr__AttributeError: ResultSet object has no attribute 'find_allDid you call find_all() when you meant to call find()? 我尝试根据消息将find替换为find_all，但这并没有改变返回的错误。en.wikipedia.org/wiki/2020%E2%80%9321_Top_14_s

浏览 42提问于2020-09-23得票数 1

回答已采纳

1回答

在BS4中使用find_all的困难

、、、

我正在使用Beautiful Soup4从网页中抓取一些文本到一个不和谐的机器人中。运行该命令，这将返回"ThaIIen“(这是应该的)。如果我简单地将find更改为find_all，它将返回"Not found!“为什么？它不应该返回文档中所有字体大小为4的文本吗？

浏览 4提问于2017-02-12得票数 0

1回答

有没有OrderedDict的理解？

、

我不知道是否有这样的事情--但我正在尝试做一个有序的字典理解。然而，它似乎不起作用？import requestsfrom collections import OrderedDict tables = soup.find_all('table')rows = tables[1].find_all<

浏览 2提问于2015-10-02得票数 31

回答已采纳

1回答

使用BS4的Python语言中的WebScraping -获取动态生成的列表

、、

我需要抓取这个列表中的“最佳编码训练营”列表：https://www.switchup.org/rankings/best-coding-bootcamps 我的任务是应该可以使用BeautifulSoup (而不是Selenium)，然而，当我尝试这样做时，结果HTML不会返回训练营的列表，而是返回一个似乎是类的空元素：我的问题是，您认为只有使用Beautiful Soup才能检索到这些

浏览 6提问于2019-12-08得票数 1

回答已采纳

1回答

具有相同类的多个元素

、、、

当我运行时： syn = soup.find('ul', class_='list') print(syn.text) 我只获得了类('ul', class_='list')的第一个元素的文本如何才能获得具有相同类名的第二个元素的文本

浏览 23提问于2020-10-01得票数 0

回答已采纳

1回答

如何在美丽的汤中分离tds和获得第n位td？

、、

bob</a></td><td>2</td><td>4</td> 我想跳过第一个td align=“左”，因为它没有标题，我想把标题和第三个td放在一个元组列表中我已经看到了使用soup.findAll()和片获取第n行的答案，但是我如何获得特定的tds呢？所有的建议将是有用的，并将有助于推进我的网络抓取之旅。谢谢!

浏览 2提问于2020-02-12得票数 0

回答已采纳

5回答

BeautifulSoup父标记

、、

我试过：和print(up.parent) 我和.parents试过，我试过find_all

浏览 3提问于2014-02-25得票数 21

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Beautiful Soup find_all()返回有序列表吗？

相关·内容

Beautiful Soup find_all()返回有序列表吗？

从特定标签返回文本

非类型错误/没有使用python的漂亮汤打印的元素

美汤刮擦表返回的是字符串列表而不是列表列表

美丽的Soup find_all()返回奇怪的标签而不是结果

索引似乎存在时超出范围

使用BeautifulSoup by class抓取返回空列表

BeautifulSoup在find_all之后获得href

如何使用Beautiful soup从HTML锚标记返回目的地

在python // html中解析数据时遇到问题

为什么find_all会给出一个错误，即使在查找中没有错误？(Python美丽汤)

并非所有从Beautifulsoup find_all方法返回的HTML元素

AttributeError: ResultSet对象没有属性“find_all”

BeautifulSoup -在多个‘表’上使用find_all时的AttributeError

在BS4中使用find_all的困难

有没有OrderedDict的理解？

使用BS4的Python语言中的WebScraping -获取动态生成的列表

具有相同类的多个元素

如何在美丽的汤中分离tds和获得第n位td？

BeautifulSoup父标记

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐