我试图抓取一个,但是我没有得到一些元素,因为这些元素是动态创建的。
我在node.js中使用了cheerio,代码如下所示。
var request = require('request');
var cheerio = require('cheerio');
var url = "http://www.bdtong.co.kr/index.php?c_category=C02";
request(url, function (err, res, html) {
var $ = cheerio.load(html);
$(
我使用Node.js启动了一个新项目,我想知道是否有任何方法可以管理从cheerio.load()函数返回的内容。我已经尝试使用回调和承诺(然后和捕获),但它不起作用。
示例:
var $ = cheerio.load(html);
//what if it's falied ???? how I can handle it?
我之所以这样问,是因为我试着多次运行脚本,但有时是工作,有时不是。
顺便说一下:我使用的是npm site -> npm install cheerio.的cheerio模块。
谢谢:-)
在上面网站的中心,你可以看到一个电子邮件地址被封装在"mailto“html部分中。使用jQuery可以相当容易地将此邮件作为字符串获取,如下所示:
$('a[href^="mailto:"]').text
然而,当我想要在cheerio库中使用node.js (它应该像jquery一样工作)时,它就不能工作了。
let $ = cheerio.load(html) // launching cheerio with html code requested from website
let mailto = $('a[href
我用node.js编写了一个非常小的脚本,使用request和cheerio来解析连接到links的titles,我已经从它的登陆页面中删除了该脚本。
问题是,我不知道如何将链接(从第一个函数填充)传递到第二个函数,以便从那里获得标题。我对node.js非常陌生,所以不知道如何从第一个函数返回结果并将它们传递给后者。
我所犯的错误是:
for (const link of links) {
^
ReferenceError: links is not defined
这是完整的脚本:
var request = require('request
这是在浏览器中工作的,但是当我试图对cheerio和node.js做同样的事情时,它就不起作用了:
var request = require('request');
var cheerio = require('cheerio');
var url = 'https://www.google.fr/search?ei=apX6WdzaIMzWUabjqvAF&q=ok&oq=ok&gs_l=psy-ab.3..0i67k1l4j0j0i67k1l2j0i131k1j0j0i67k1.2633.3962.0.4021.3
我想从一些维基百科页面中获取div mw-content-text的内容(这只是学习node.js的例子),我已经这样做了:
var fetch = require('node-fetch');
var cheerio = require('cheerio');
var fs = require('fs');
var vv = [
'https://en.wikipedia.org/wiki/Ben_Silbermann',
'https://en.wikipedia.org/wiki/List_of_Inte
我是node.js和cheerio的初学者,一点帮助就好了:D
我试着刮掉pubg.op.gg网站,使其有两个简单的元素来显示在控制台中。这是我的代码:
var url = "https://pubg.op.gg/user/K1uu"
var request = require('request');
var cheerio = require('cheerio');
var cheerioAdv = require('cheerio-advanced-selectors');
request(url, function(err
我正在尝试使用带有Node.js请求库的Cheerio来检索关于图像的元数据。看起来,当我向一个以.jpg、.png等结尾的网址发出HTTP GET请求时,它会发回整个文件,而我无法访问响应中的超文本标记语言。因此,我的问题是,给定一个图像的URL,我如何在向该URL发出请求时只读取HTML或元数据,而不是下载整个图像文件?
例如,下面是我拥有的一些简单代码:
var request = require('request');
var cheerio = require('cheerio'); // cheerio is just used to
我尝试使用cheerio仅提取div的内容,而不提取该div的任何子项。如果我只使用div.text() -我会得到所有的文本-父类和子类。这是HTML -我只需要值"5.25“
下面的代码当前返回“购买价格$5.25”
下面的HTML:
<div class="outer tile">
< ... various other html here >
<div class="cost">
<span class="text">Purchase price
好了,为了好玩,我决定刮掉所有在moodle网站上注册的大学用户。
这是我用Node.js和cheerio编写的程序,它抓取了站点,但我似乎无法获得H2标记中的文本。
这是我正在抓取的网站,,我所需要做的就是更改ID号,然后它就会遍历每个学生。
var request = require('request'),
cheerio = require('cheerio');
urls = [];
//For just single page, eventually will loop through each page.
我正在尝试用node.js开发一个系统,它每60秒更新一次视频标题。现在,我正在试着获取视图的数量,然后再做剩下的。我的啦啦队API有问题。然后,我使用如下的页面源获取响应:
console.log("Strumento avviato!")
//TODO: get views number with scraping
const urlV = 'XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX';
const axios = require("axios").default;
con
我有一个node.js应用程序,从一个网站上收集信息。我正在使用npm包、请求和cheerio,并且刮取很好,但是当请求函数完成时,我想做一些其他的事情。下面是一些代码:
app.js
var express = require('express');
var extractor = require("./extractor");
console.log(extractor('http://www.example.com'));
var app = express();
app.get('/', function (req, re
var fs = require('fs');
var request = require('request');
var cheerio = require('cheerio');
var link = "www.google.com";
request(link, function (error, response, html) {
if (!error && response.statusCode == 200) {
var $ = cheerio.load(html);