腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
使用
Apify
和
Puppeteer
抓取
URL
、
、
、
、
我正在尝试
使用
()从中
抓取
URL
async function pageFunction( context ) { const
url
= 'https://en.wikipedia.org/wiki/pageTitle = $('title
浏览 18
提问于2020-02-28
得票数 1
回答已采纳
3
回答
如何
使用
apify
sdk让
puppeteer
无头运行?
、
、
、
、
我正在尝试
使用
apify
sdk
抓取
页面内容。这也可以与以下代码很好地配合
使用
。但是我怎么才能像
puppeteer
.launch一样强制
使用
Apify
SDK的无头模式({ headless : true})?= "https://somepage/"; process.env.
APIFY
_LOCAL_STORAGE_DIR = '/someappfolder/
浏览 49
提问于2020-10-12
得票数 1
2
回答
使用
Apify
进行Web
抓取
、
、
、
、
我正在尝试从中
抓取
URL
我的
Apify
角色
使用
Puppeteer
平台。所以我
使用
的是pageFunction 。
浏览 17
提问于2020-02-25
得票数 1
1
回答
找不到木偶剧相关模块
和
依赖项
、
、
、
、
我
使用
npm安装了
puppeteer
,然后在尝试编译它时,出现了以下错误: To install it, you can run: npm install --save ws/node_modules/
puppeteer
/node_modules/mime
浏览 1
提问于2019-04-04
得票数 1
1
回答
将cookie从Actor传递给Crawler
我用我想要
抓取
的
URL
设置了一个爬虫,演员正在工作,我用cookie/截图示例进行了测试。我只是在演员
和
爬虫之间传递cookie时遇到了问题: const
Apify
= require('
apify
'); const input= await
Apify
.getValue('INPUT'); const browser = await
浏览 26
提问于2019-05-10
得票数 0
1
回答
为什么
Puppeteer
solveRecaptchas()的“不是一个函数”?
、
、
我试图通过
使用
Puppeteer
和
来解决登录页面上的Recaptcha问题。const
puppet
浏览 0
提问于2021-10-17
得票数 1
回答已采纳
1
回答
在
使用
时,未能在“innerHTML”属性上设置“元素”
、
我试图
使用
app在Play Store上
抓取
应用程序的页面,并检索一些信息来构建一个定制的RSS提要,类似于显示的。_evaluateInternal (/home/myuser/node_modules/
puppeteer
/lib/cjs/
puppeteer
/common/ExecutionContext.js:175-08-27T07:13:48.103Z at async wrap (/home/
浏览 8
提问于2022-08-28
得票数 0
1
回答
Apify
-如何在数据集中包含失败的结果
、
、
、
我们
使用
Apify
Web Scraper执行元创建一个
URL
验证任务,该任务返回输入
URL
、页面标题
和
HTTP响应状态代码。我们有一组5个正在
使用
的测试
URL
:4个有效,1个不存在。成功的结果始终包含在数据集中,但不包括失败的
URL
。_handleRequestTimeout (/home/myuser/node_modules/
apify
/build/crawlers
浏览 18
提问于2021-05-05
得票数 0
回答已采纳
1
回答
如何在Google云功能上
使用
Apify
、
、
我正在部署一些
使用
Apify
作为Google函数的代码。当触发时,云函数将无声地终止。我做错了什么?下面我用更简单的代码重现了这个问题。虽然本例并不严格要求
Apify
,但我希望能够
使用
Apify
提供的额外功能。
使用
Apify
的代码: const
Apify
= require(&
浏览 0
提问于2019-07-10
得票数 0
回答已采纳
1
回答
如何用
Apify
实现iframe表单数据序列化
、
好的,我试着序列化一个表单数据,但是我在下面的代码中没有定义: const frame = page.frames().find(frame => frame.
url
().includes('reservation
浏览 16
提问于2019-09-23
得票数 1
回答已采纳
1
回答
向p-queue添加函数以处理并发停止队列
、
我正在
使用
和
Puppeteer
。我们的目标是运行X个Chrome实例,其中p-queue限制了并发数量。当队列中的任务发生异常时,我希望重新排队。但是当我这样做的时候,队列就会停止。_count++; try {_
url
);
浏览 0
提问于2019-10-14
得票数 0
1
回答
使用
木偶时,快门停止收听
、
、
我目前正在编写一个简单的API,它正在通过
Puppeteer
执行操作,但是,当我试图执行我的脚本以便访问API时,我的Express应用程序似乎在
Puppeteer
打开后停止了侦听吗?这是我的剧本:const
puppeteer
= require('
puppeteer
-extra');
浏览 1
提问于2020-06-13
得票数 0
回答已采纳
1
回答
配置
puppeteer
的chromium浏览器的语言还是
使用
Apify
代理?
、
、
、
、
在args中配置
puppeteer
Crawler启动选项是否更好,就像在puppeter中那样: const pptr = require("
puppeteer
"); headless: false, '--lang=fr' })(); 在
Apify
中,据我所知将是这样的: const
Apify
= requir
浏览 45
提问于2020-09-25
得票数 0
1
回答
如何
使用
Puppeteer
添加输入
、
、
我试图通过提供案例编号来
抓取
https://web6.seattle.gov/courts/ECFPortal/Default.aspx中的案例信息和文档。const
Apify
= require('
apify
');
puppeteer
const saveScreen = async(page,(key, screenshotBuffer, { content
浏览 19
提问于2019-10-07
得票数 0
回答已采纳
1
回答
应用从sitemap.xml中
抓取
urls
、
Apify
可以从sitemap.xml
抓取
链接 const requestList}...`);
url
: request.
url
,
浏览 0
提问于2019-08-20
得票数 3
回答已采纳
2
回答
为什么"context.
Apify
“没有定义
、
、
我正在学习如何在
Apify
Web-Scraper中
使用
request,我不明白它是如何工作的。 我首先用Postman做了这件事,我确实得到了我想要的结果,现在我想在
Apify
上做同样的事情。const request = new context.
Apify
.Request({
url
:...
浏览 20
提问于2019-09-02
得票数 0
回答已采纳
2
回答
使用
Apify
/
Puppeteer
,
抓取
所有
URL
,但包含一个单词的
URL
除外
、
有了
Apify
/
Puppeteer
,除了包含某个单词的页面外,我还能爬行所有页面吗?在handlePageFunction内部,原始代码如下所示 requestQueue,如果我想避免包含"foo“的页面
URL
,那么我是否可以在pseudoUrls中调整一些内容来修复这个问题呢?
浏览 14
提问于2022-07-08
得票数 1
回答已采纳
1
回答
如何
使用
基本身份验证访问页面(
Apify
SDK)
、
、
在
puppeteer
文档中,我发现可以
使用
await page.authenticate({ username: 'test', password: 'test' });访问具有基本身份验证的页面。
Apify
.main(async () => { await requestQueue.addRequest({
浏览 20
提问于2020-10-09
得票数 0
回答已采纳
1
回答
使用
Apify
抓取
多个页面
、
可以
使用
带有伪
URL
的
Apify
抓取
多个页面吗? 当人们问同样的问题时,答案大多指向伪
URL
,如果有可能或不可能这样做,并不会直接解决问题。如果我在运行爬虫的时候不知道伪
URL
,并且我从一个页面上
抓取
了10个链接-然后想要
抓取
这10个链接,那怎么做呢?https://kb.
apify
.com/tutorial-creating-your-first-crawler/crawling-multip
浏览 15
提问于2019-03-19
得票数 0
2
回答
如何
使用
Apify
登录到网站并单击按钮?
、
、
我需要
使用
和
来自动登录到一个受密码保护的网页,并点击一个按钮。我该怎么做?目标
URL
将不时更改。") 据我所知,这不是一个刮擦的工作,因为我不希望从网页返回数据,所以我不应该
使用
或。到目前为止,我有以下几点。然而,
Apify
时间内的
Puppete
浏览 1
提问于2019-10-03
得票数 3
点击加载更多
相关
资讯
推荐一款开源的网络爬虫和浏览器自动化库:Crawlee!
Python网络爬虫抓取网页的含义和URL基本构成
Python网络爬虫:抓取网页的含义和URL基本构成
江湖秘笈:简单快速的URL抓取和漏扫两用工具 Paros Proxy很适合Web网站安全测试使用
一个浏览器自动化操作的.Net开源库
热门
标签
更多标签
云服务器
ICP备案
云直播
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券