scrapy js - 腾讯云开发者社区

文章/答案/技术大牛

发布

2回答

Scrapy支持JavaScript进行网络爬行吗？

、、、

我听说scrapy不支持javascript。我想知道我是否可以使用scrapy抓取我们内部网站的链接，我们的内部网站有javascript，我相信当你点击一个链接时它就会生成，但我不是100%确定。我还能不能用scrapy的爬虫抓取每个链接？如果我不能，你能推荐另一个我可以使用的工具吗？支持javascripts和post身份验证登录(Https)。谢谢!

浏览 2提问于2013-07-16得票数 0

2回答

使用Scrapy下载所有JS文件？

、

我试图爬行一个网站，搜索所有的JS文件来下载它们。我刚接触Scrapy，我发现我可以使用CrawlSpider，但我似乎对LinkExtractors有一个问题，因为我的解析器没有执行。import scrapyfrom scrapy.linkextractors import LinkExtractor'example.com'] start_urls = ['http:

浏览 25提问于2021-02-17得票数 0

回答已采纳

1回答

刮伤中的ItemLoader

、

import scrapyfrom scrapy.loader import ItemLoader articles = response.xpath('//div[@class="postArticle postArticle--short js-postArticlejs-

浏览 1提问于2020-02-24得票数 0

回答已采纳

1回答

因此，在抓取这个url之前，我通过scrapy登录，然后通过这个结果页面登录。但是，即使这个页面的http响应是200，它也不会丢弃任何数据。守则如下：from scrapy.spider import BaseSpiderfrom scrapy.selectorimport HtmlXPathSelector from scrapy.contrib.spiders import CrawlSpider, R

浏览 3提问于2013-05-31得票数 5

2回答

如何获得一个具有精确的web抓取类名称的值

、

您可以看到，某些类具有:js-变量，而有些类禁用js-变体。但是这不能正常工作，并且给出了所有的值，即使是在其中禁用了类的值。

浏览 4提问于2022-11-01得票数 0

回答已采纳

1回答

如何使用scrapy从页面中提取所有href内容

、

我想使用Scrapy从一个给定的网站获得所有链接。我正试着这样做-import unidecodefrom scrapy.linkextractorsimport LinkExtractor name = 'linkdataparse(self, r

浏览 3提问于2016-10-07得票数 2

回答已采纳

1回答

无法锻炼如何让css选择器在刮刮中刮擦

、、、

我正在努力刮这个，并且我很难理解css选择器与Scrapy一起工作。css css：.css-truncate-target .messagetime-ago.css-truncate-target .message::texttime-ago::textimport scrapy<

浏览 3提问于2017-12-03得票数 1

回答已采纳

1回答

如何在javascript文件中执行scrapy* python？*

、、

我有一个用命令scrapy crawl mynamefile启动的python脚本。我想从我的node js应用程序的js文件中运行python cli命令scrapy crawl，然后在控制台中显示它。问题是我不知道如何在节点中导入scrapy python库。谢谢你的帮忙!

浏览 24提问于2019-03-07得票数 0

1回答

为什么Scrapy中的数据没有完全加载视图(响应)？

、

我正试着用Scrapy从Youtube上收集一些评论。但是，当我进入scrapy shell模式并使用view(response)打开它时，除了加载旋转器之外，我找不到任何注释。scrapy shell https://www.youtube.com/watch?v=kkl7-NzqxWo在注释部分显示无限旋转器。

浏览 1提问于2018-12-01得票数 0

回答已采纳

2回答

无法使用刮伤认证fandromeda

、、

import scrapyfrom scrapy.http import Request, FormRequestfrom fandromeda.items import FandromedaItem class FandromedaC(CrawlSpider我注意到，在默认情况下，scrapy正在发出get请求而不是post。scrapy</

浏览 4提问于2016-12-01得票数 0

回答已采纳

1回答

未在PythonAnywhere.com上启用刮擦项管道

、、、、

│ ├── bootstrap.bundle.min.js│ │ │ ├── bootstrap.js│ │ │ ├── bootstrap.min.js│ │ │ └── bootstrap.min.js

浏览 21提问于2019-03-17得票数 2

回答已采纳

1回答

、、、、

我试图用Scrapy登录一个网站，但收到的响应是一个只包含内联JavaScript的超文本标记语言文档。JS重定向到我想要从中抓取数据的页面。但是Scrapy不执行JS，因此不会路由到我想要的页面。'request_id': request_id, }print

浏览 72提问于2017-06-22得票数 3

2回答

使用Scrapy* Splash将响应存储为文件*

、、、、

import scrapy author = scrapy.Field= ["http://quotes.toscrape.com/js/"] for url in self.start_urls\tutorial\spi

浏览 5提问于2020-10-14得票数 4

回答已采纳

1回答

为什么刮痕不发送正确的url？

、、、、

parse: url = 'http://quotes.toscrape.com/js=0.8", "Accept-Language": "en"}, "html": 1, "png": 0, "url": "http://quotes.to

浏览 4提问于2020-08-02得票数 0

回答已采纳

点击加载更多

Scrapy支持JavaScript进行网络爬行吗？

使用Scrapy下载所有JS文件？

刮伤中的ItemLoader

使用scrapy从facebook中抓取数据

如何获得一个具有精确的web抓取类名称的值

如何使用scrapy从页面中提取所有href内容

无法锻炼如何让css选择器在刮刮中刮擦

如何在javascript文件中执行scrapy* python？*

为什么Scrapy中的数据没有完全加载视图(响应)？

无法使用刮伤认证fandromeda

未在PythonAnywhere.com上启用刮擦项管道

用JS流行Python刮取数据

基于邮编的动态数据提取方法

无法获取scrapy* javascript完整响应*

试图确定为什么我的xpath在Scrapy中失败

带有MongoDB的刮伤管道不起作用

Scrapy & Splash没有从javascript页面返回任何内容

在Scrapy响应中执行内联JavaScript

使用Scrapy* Splash将响应存储为文件*

为什么刮痕不发送正确的url？

相关资讯

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐