从beautifulSoup中拉取多个HTML标签可以使用find_all()方法。该方法可以根据指定的标签名称、属性、文本内容等条件,返回匹配的所有标签对象列表。
以下是一个示例代码:
from bs4 import BeautifulSoup
# 假设html是你要解析的HTML文档
html = '''
<html>
<body>
<div class="container">
<h1>标题1</h1>
<p>段落1</p>
</div>
<div class="container">
<h1>标题2</h1>
<p>段落2</p>
</div>
</body>
</html>
'''
# 创建BeautifulSoup对象
soup = BeautifulSoup(html, 'html.parser')
# 使用find_all()方法获取所有<div>标签
div_tags = soup.find_all('div')
# 遍历所有<div>标签
for div in div_tags:
# 获取<div>标签下的<h1>和<p>标签
h1_tag = div.find('h1')
p_tag = div.find('p')
# 打印标签内容
print('标题:', h1_tag.text)
print('段落:', p_tag.text)
print('---')
输出结果:
标题: 标题1
段落: 段落1
---
标题: 标题2
段落: 段落2
---
在上述示例中,我们首先创建了一个BeautifulSoup对象,然后使用find_all()方法获取所有的<div>标签。接着,我们遍历每个<div>标签,并使用find()方法获取<div>标签下的<h1>和<p>标签。最后,我们打印出每个标签的内容。
推荐的腾讯云相关产品:腾讯云服务器(CVM)和腾讯云对象存储(COS)。
领取专属 10元无门槛券
手把手带您无忧上云