BeautifulSoup是一个用于解析HTML和XML文档的Python库,它提供了一种简单而灵活的方式来遍历和搜索文档树。find_all()函数是BeautifulSoup库中的一个方法,用于根据指定的标签名、属性、文本内容等条件来查找文档中的所有匹配元素。
该函数的语法如下:
find_all(name, attrs, recursive, text, limit, **kwargs)
参数说明:
该函数返回一个列表,包含所有匹配的元素。
使用示例:
from bs4 import BeautifulSoup
html = """
<html>
<head>
<title>Example</title>
</head>
<body>
<div class="content">
<h1>Heading 1</h1>
<p>Paragraph 1</p>
<p>Paragraph 2</p>
</div>
<div class="content">
<h1>Heading 2</h1>
<p>Paragraph 3</p>
</div>
</body>
</html>
"""
soup = BeautifulSoup(html, 'html.parser')
divs = soup.find_all('div', class_='content')
for div in divs:
h1 = div.find('h1')
print(h1.text)
paragraphs = div.find_all('p')
for p in paragraphs:
print(p.text)
输出结果:
Heading 1
Paragraph 1
Paragraph 2
Heading 2
Paragraph 3
推荐的腾讯云相关产品和产品介绍链接地址:
领取专属 10元无门槛券
手把手带您无忧上云