puppeteer使用alt属性从html获取img

Puppeteer是一个由Google开发的Node.js库，用于控制无头浏览器（Headless Chrome）进行自动化测试、网页截图、爬虫等任务。它提供了一组API，可以模拟用户在浏览器中的操作，如点击、填写表单、截图等。

在使用Puppeteer从HTML中获取img标签的alt属性时，可以通过以下步骤实现：

安装Puppeteer：在Node.js环境中，使用npm或yarn安装Puppeteer库。
导入Puppeteer库：在代码中导入Puppeteer库，以便使用其提供的API。

const puppeteer = require('puppeteer');

启动无头浏览器：使用Puppeteer的launch方法启动一个无头浏览器实例。

const browser = await puppeteer.launch();

创建新页面：通过浏览器实例的newPage方法创建一个新的页面对象。

const page = await browser.newPage();

导航到目标页面：使用页面对象的goto方法导航到目标页面。

await page.goto('https://example.com');

获取img标签的alt属性：通过页面对象的evaluate方法，在页面上下文中执行JavaScript代码，获取img标签的alt属性。

const altAttributes = await page.evaluate(() => {
  const imgElements = Array.from(document.querySelectorAll('img'));
  return imgElements.map(img => img.alt);
});

打印或处理获取到的alt属性：对获取到的alt属性进行打印或进一步处理。

console.log(altAttributes);

关闭浏览器：使用浏览器实例的close方法关闭浏览器。

await browser.close();

Puppeteer的优势在于它可以完全模拟用户在浏览器中的操作，具有较高的灵活性和可扩展性。它适用于各种场景，包括自动化测试、网页截图、爬虫、数据抓取等。

腾讯云提供了Serverless Cloud Function（SCF）服务，可以用于部署和运行无服务器的Node.js应用程序。您可以使用SCF来托管和运行使用Puppeteer库的应用程序。通过SCF，您可以实现按需计费、高可用性和弹性伸缩等特性。

更多关于腾讯云SCF的信息，请访问：腾讯云Serverless Cloud Function

请注意，本回答中没有提及亚马逊AWS、Azure、阿里云、华为云、天翼云、GoDaddy、Namecheap、Google等流行的云计算品牌商，以遵守您的要求。

相关·内容

vue 项目中从session中获取对象，并且使用里面的属性

DOMParser解析TikTok页面中的图片元素

DOMParser解析TikTok页面中的图片元素

领导让我做 PPT，我用代码来生成

LLM生态下爬虫程序的现状与未来

从网页中提取结构化数据：Puppeteer和Cheerio的高级技巧

【前端探索】移动端H5生成截图海报的探索

【02】仿站技术之python技术，看完学会再也不用去购买收费工具了-本次找了小影-感觉页面很好看-本次是爬取vue需要用到Puppeteer库用node.js

【总结】1873- 一个前端非侵入式骨架屏自动生成方案

前端工程化 - 营销分享图解决方案

3分钟搞定图片懒加载

Node：使用Puppeteer完成一次复杂的爬虫

第50次文章：JQuery基础

一文入门jQuery

spa 如何达到ssr 的秒开技术方案——预渲染

懒加载的实现原理

node爬取新型冠状病毒的疫情实时动态

我写了一个自动化脚本涨粉，从0阅读到接近100粉丝

scrollLeft等属性介绍

SPA 如何达到 SSR 一样的秒开效果？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐