首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

使用puppeteer在google图像上获取img src

Puppeteer是一个由Google开发的Node.js库,用于控制和自动化Chrome或Chromium浏览器。它提供了一组API,可以模拟用户在浏览器中的操作,例如导航、表单提交、点击、滚动等。使用Puppeteer可以方便地在Google图像搜索结果页面上获取图片的src属性。

在使用Puppeteer获取Google图像搜索结果页面上的img src时,可以按照以下步骤进行操作:

  1. 安装Puppeteer:在命令行中运行以下命令来安装Puppeteer库:
代码语言:txt
复制
npm install puppeteer
  1. 导入Puppeteer库:在你的代码中导入Puppeteer库,以便使用其提供的API:
代码语言:txt
复制
const puppeteer = require('puppeteer');
  1. 启动浏览器实例:使用Puppeteer的launch方法启动一个浏览器实例:
代码语言:txt
复制
const browser = await puppeteer.launch();
  1. 创建新页面:通过浏览器实例创建一个新的页面对象:
代码语言:txt
复制
const page = await browser.newPage();
  1. 导航到Google图像搜索页面:使用goto方法导航到Google图像搜索页面:
代码语言:txt
复制
await page.goto('https://www.google.com/imghp');
  1. 输入搜索关键字:使用type方法在搜索框中输入关键字,并按下回车键进行搜索:
代码语言:txt
复制
await page.type('input[name="q"]', 'your search keyword');
await page.keyboard.press('Enter');
  1. 等待搜索结果加载完成:使用waitForSelector方法等待搜索结果加载完成:
代码语言:txt
复制
await page.waitForSelector('img[jsname="Q4LuWd"]');
  1. 获取图片的src属性:使用evaluate方法在页面上下文中执行JavaScript代码,获取图片的src属性:
代码语言:txt
复制
const imgSrcs = await page.evaluate(() => {
  const images = document.querySelectorAll('img[jsname="Q4LuWd"]');
  return Array.from(images).map(img => img.src);
});
  1. 打印或处理获取到的图片src:对获取到的图片src进行打印或进一步处理:
代码语言:txt
复制
console.log(imgSrcs);
// 或者进行其他操作
  1. 关闭浏览器实例:在完成操作后,记得关闭浏览器实例:
代码语言:txt
复制
await browser.close();

这样,你就可以使用Puppeteer在Google图像搜索页面上获取图片的src属性了。

推荐的腾讯云相关产品:腾讯云函数(云函数是一种无服务器计算服务,可以在云端运行代码),产品介绍链接地址:https://cloud.tencent.com/product/scf

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

  • 使用交叉点观察器延迟加载图像以提高性能

    在自己平时浏览一些大量图片类的网站时,你会发现无论是你pc端下拉滚动条,还是移动端手动滑屏时,最终呈现的图片有时候会有所延迟,这是一种预先加载图片资源的方式,也就是俗称懒加载,实现该效果,通常有两种方式,分别是线性式(下拉窗帘式的)和渐进式(拨开晨雾见日明)图片加载,至于前者这里暂且不谈,本文主要是介绍后者,在本文中主要给img标签添加一data-src属性(实际图片URL),以及src属性(存储相同图像的非常小的分辨率路径图片),在加载图片时,给用户过度从模糊淡入到图片清晰,当然更重要的是其中的js处理,如果文有误导的地方,欢迎路过的老师多提意见和指正

    01
    领券