Pyppeteer 是一个无头浏览器控制库,它是基于 Puppeteer 的 Python 版本,主要用于自动化网页操作,如网页截图、表单提交、UI 测试等。在 Linux (Ubuntu 16.04) 上使用 Pyppeteer 从 div 元素中提取文本,可以通过以下步骤实现:
以下是一个简单的示例代码,展示如何使用 Pyppeteer 在 Linux 上从 div 元素中提取文本:
import asyncio
from pyppeteer import launch
async def main():
browser = await launch()
page = await browser.newPage()
await page.goto('https://example.com')
# 假设我们要提取的 div 元素的 class 是 'content'
content = await page.evaluate('''() => {
return document.querySelector('.content').innerText;
}''')
print(content)
await browser.close()
asyncio.get_event_loop().run_until_complete(main())
pyppeteer-install
脚本来自动下载和安装所需的浏览器版本。sudo
命令来运行脚本,或者调整文件和目录的权限。请注意,由于 Ubuntu 16.04 已经停止了官方支持,建议升级到一个受支持的 Ubuntu 版本,以获得更好的兼容性和安全性。
领取专属 10元无门槛券
手把手带您无忧上云