在Python中使用Xpath,可以使用第三方库如lxml或BeautifulSoup。以下是使用lxml库的示例:
pip install lxml
from lxml import etree
html = '''
<html>
<body>
<div class="container">
<h1>标题</h1>
<p>内容</p>
</div>
</body>
</html>
'''
# 解析HTML
root = etree.HTML(html)
# 使用Xpath选择器提取内容
h1_text = root.xpath('//h1/text()')[0]
p_text = root.xpath('//p/text()')[0]
print('h1文本:', h1_text)
print('p文本:', p_text)
输出:
h1文本: 标题
p文本: 内容
在这个示例中,我们使用Xpath选择器//h1/text()
和//p/text()
分别提取了<h1>
和<p>
标签的文本内容。
领取专属 10元无门槛券
手把手带您无忧上云