腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
cheerio
从
使用
cheerio
提取
的
链接
中
抓取
数据
、
、
、
正在
使用
cheerio
和nodejs
从
allegro网站获取
数据
,以在API
中
创建端点,该API返回csv
数据
这些
数据
将在稍后作为
数据
科学项目的一部分进行研究:为了获得汽车信息,我设法
从
第一页刮掉
链接
,每个
链接
将您发送到汽车(汽车项目),以查看汽车
的
完整信息,我需要从每个
链接
刮更多
的</e
浏览 18
提问于2020-06-09
得票数 1
3
回答
使用
NodeJS
抓取
、
、
、
我需要从循环中
的
url中
提取
链接
,所以基本上我需要再次执行函数,但我不知道如何
使用
nodejs实现这一点。var request = require('request');var searchTerm = 'baloncesto'; $(links).each(function(i,link){ console.log(url
浏览 19
提问于2019-02-07
得票数 1
1
回答
如何在NodeJS
中
读取html响应并创建JSON
、
、
、
、
我有一个端点,我必须
使用
它来获取一些细节,但是响应是以html格式读取,用来格式化html和有效
的
JSON对象,如下所示<script type="text/javascript">_page.startPagepage.endPage()</script></body> 需要找出细节32
浏览 2
提问于2022-02-03
得票数 0
2
回答
缩短axios text/html响应
、
、
、
、
我正在向一个网页发送一个Axios请求,要求
从
其中
抓取
一个小字符串,但返回
的
响应是一个很大
的
html,而我只需要它
的
一小部分,有没有办法缩短响应,这样我就可以保存
数据
并使请求更快?
浏览 20
提问于2021-01-27
得票数 0
回答已采纳
2
回答
获取NodeJS
中
已解析
的
Markdown文件
的
前两个HTML元素
、
、
、
假设我有一个动态解析
的
Markdown文件,并返回以下或类似的输出:在本例
中
,我想返回h1和第一个p标记。你认为这有可能以可靠
的
方式实现吗?我只想获得具有前两个元素
的</em
浏览 0
提问于2018-10-26
得票数 0
2
回答
使用
node.js和request
提取
所有超
链接
(来自外部网站)
、
、
现在,我们
的
应用程序将nodejs.org
的
源代码写入控制台。我们希望它改写nodejs.org
的
所有超
链接
。也许我们只需要一行代码就可以
从
body获取
链接
。
浏览 0
提问于2013-03-12
得票数 21
回答已采纳
1
回答
努力
抓取
多个页面-
Cheerio
.js
、
、
、
、
我正在尝试
使用
Javascript和
Cheerio
创建一个网络爬行器,当我试图
从
抓取
的
页面
中
的
url
中
抓取
数据
时,我遇到了一些困难。例如,我
抓取
第一个页面的一些细节(包括
链接
页面的URL ),然后当我尝试
使用
回调函数
抓取
链接
页面时,我无法将返回值赋给对象。这两个
抓取
器单独工作,但是我在让它们异步运行时遇到了问题
浏览 0
提问于2020-02-19
得票数 0
2
回答
与对象内部
的
HTML交互
、
、
我
使用
axios
从
getnada.com messages返回这个对象。下面的对象是axios返回
的
内容。在这个对象中有一些html代码(尽我最大
的
努力清理html)。是否有任何方式在url上启动带有id="ActivateButton“
的
单击事件?我
使用
的
是node.js和selenium-webdriver。
浏览 0
提问于2018-07-25
得票数 3
回答已采纳
1
回答
如何
从
html中
提取
javascript?
、
、
我正在创建一个用javascript编写
的
web
抓取
程序,
使用
request和
cheerio
。我试图
提取
的
网页在html
中
包含javascript。这是我感兴趣
的
javascript,但是找不到访问它
的
方法。有没有办法
使用
cheerio
来
提取
javascript?var
浏览 6
提问于2015-02-26
得票数 1
1
回答
Node:如何确保函数只在对象创建后才运行?
、
我正在
使用
nodejs和
cheerio
从
网站上
抓取
数据
,然后它会从这些
数据
中
创建一个对象。然后,它需要获取该对象并在函数中
使用
它。问题是,我
的
对象正在创建中,但在
cheerio
可以正确解析
数据
并将其放入对象之前,下一个函数已经在运行。下面是我
的
代码: request(link, function(err, resp,
浏览 0
提问于2013-06-07
得票数 0
回答已采纳
1
回答
使用
nodeJs进行XML
抓取
、
、
、
、
我有一个非常大
的
xml文件,它是我
从
tally导出所有
数据
后得到
的
,我试图
使用
网络
抓取
来
从
我
的
代码中
提取
元素,但我在格式或类似的东西上遇到了问题。
使用
fs.readFileSync()读取它可以很好地工作,并且console.log会显示完整
的
xml文件,但是当我
使用
fs.writeFileSync编写文件时,它会显示如下所示: ? 而我
的
web
抓取</
浏览 11
提问于2020-06-30
得票数 0
2
回答
用vue js进行Web
抓取
、
、
我期待着用Vue js制作一个网络
抓取
应用程序。 对于上面提到
的
套餐,我还需要做些什么或更好
的
选择吗?
浏览 2
提问于2020-07-06
得票数 1
2
回答
是速度慢
的
是pjscrape,还是PhantomJS?替代铲运机?
、
、
、
我刚刚编写了我
的
第一个脚本,但是我发现它运行得非常慢。我对偷东西和幻影都很陌生,所以我不知道哪一个是罪魁祸首。pjs.addSuite({ }); return resu
浏览 3
提问于2013-06-28
得票数 2
回答已采纳
1
回答
ionic 4解析和
提取
html页面
、
、
我正在
使用
ionic 4,我正在尝试找出一种方法来解析来自网站
的
特定html页面。我想将特定表格
中
的
数据
提取
到页面
中
,并
使用
这些
数据
填充一个数组。我
使用
以下代码访问html页面。我发现了很多
从
json中
提取
数据
的
例子,但在html页面上并不多见。我
使用
ionic-native/http来访问该页面。这是我
的</
浏览 13
提问于2019-02-21
得票数 0
1
回答
从
许多不同
的
网站上
抓取
文章
的
选项
、
我需要添加网页
抓取
功能到一个单页面应用程序。
使用
它,我可以简单地输入一篇文章
的
URL,该服务将从该页面检索我需要
的
所有
数据
。我通过谷歌找到了很多
抓取
解决方案,但他们大多提供定期
从
少数网站
浏览 1
提问于2015-08-16
得票数 1
1
回答
无法在函数
中
应用
抓取
下一页
的
逻辑
、
、
、
、
我已经创建了一个脚本,
使用
axios和
cheerio
从
yellowpages获取不同
的
商店名称及其相关
链接
,然后
使用
这些
链接
从
其内部页面
抓取
电话和电子邮件。脚本运行得很好。我现在想做
的
就是
使用
next page link从下一页
抓取
内容。我只是不明白如何在getLinks()函数
中
应用解析和
使用
下一页
的
逻辑。目前,这是我正在尝试
浏览 13
提问于2021-09-14
得票数 3
1
回答
运行脚本时,结果总是“未定义”。
、
、
、
、
我一直在尝试
使用
axios和
cheerio
迭代地
从
网页
中
抓取
下一个页面
链接
。当我运行脚本时,结果总是得到undefined。在没有更多
的
链接
之前,我如何获得下一页
链接
?这是我目前
的
尝试:const
cheerio
= require("
cheerio
"); const bas
浏览 3
提问于2021-09-26
得票数 1
回答已采纳
0
回答
如何
使用
Node /
Cheerio
(或其他工具)
从
站点中
抓取
全局变量?
、
、
、
页面上有一个全局变量,它包含一个对象,我想为它设置一个
抓取
器。
使用
Node / Express /潜在
的
Cheerio
最好
的
方法是什么?我理解
Cheerio
在遍历DOM时
的
好处,但是我知道我想要
抓取
的
全局变量
的
名称,只需要按照设定
的
计划
提取
它
的
信息
浏览 7
提问于2017-01-09
得票数 0
回答已采纳
1
回答
需要
使用
node.js登录
的
网页
抓取
、
、
、
、
问题陈述: 我有这个网页
中
的
每个候选人都有一个
链接
,其中包含一些信息,我想
抓取
。 因此,对于所有候选人,我必须单击
链接
并手动获取详细信息,这是一项繁琐
的
任务。 我想自动化这请帮助我。我
的
解决方案是: 我认为要自动化这项任务,我应该编写一个脚本,它会单击每个
链接
并
抓取
数据
。 但我想知道如何
抓取
一个需要登录
的
网页。 您看到
的
网页只能通过登录页面访问。如果除了这种方法之
浏览 18
提问于2019-03-02
得票数 0
回答已采纳
1
回答
从
Nightmare.js返回HTML体
、
、
我目前正在
使用
cheerio
和nightmare进行一些
抓取
工作。我之所以同时
使用
这两个工具,而不仅仅是
cheerio
,是因为我必须操纵网站才能找到我想要
抓取
的
部分,而且我发现噩梦非常擅长做这些脚本。所以,现在我正在
使用
nightmare获取,直到我需要
的
信息显示出来。在那之后,在evaluate()上,我试图以某种方式返回当前
的
html,然后将其传递给
cheerio
进行
抓取
。问题
浏览 5
提问于2016-09-26
得票数 7
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
node中使用cheerio爬取并解析html网页
使用JS和NodeJS爬取Web内容
python中如何使用正则表达式提取数据
30行代码教你爬取“扒皮吧”帖子及链接地址!
使用影刀批量提取PDF文档中的图片
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券