腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
Scrapy
支持JavaScript进行网络爬行吗?
、
、
、
我听说
scrapy
不支持javascript。我想知道我是否可以使用
scrapy
抓取我们内部网站的链接,我们的内部网站有javascript,我相信当你点击一个链接时它就会生成,但我不是100%确定。我还能不能用
scrapy
的爬虫抓取每个链接?如果我不能,你能推荐另一个我可以使用的工具吗?支持javascripts和post身份验证登录(Https)。 谢谢!
浏览 2
提问于2013-07-16
得票数 0
2
回答
使用
Scrapy
下载所有
JS
文件?
、
我试图爬行一个网站,搜索所有的
JS
文件来下载它们。我刚接触
Scrapy
,我发现我可以使用CrawlSpider,但我似乎对LinkExtractors有一个问题,因为我的解析器没有执行。import
scrapy
from
scrapy
.linkextractors import LinkExtractor'example.com'] start_urls = ['http:
浏览 25
提问于2021-02-17
得票数 0
回答已采纳
1
回答
刮伤中的ItemLoader
、
import
scrapy
from
scrapy
.loader import ItemLoader articles = response.xpath('//div[@class="postArticle postArticle--short
js
-postArticle
js
-
浏览 1
提问于2020-02-24
得票数 0
回答已采纳
1
回答
使用
scrapy
从facebook中抓取数据
、
、
、
因此,在抓取这个url之前,我通过
scrapy
登录,然后通过这个结果页面登录。但是,即使这个页面的http响应是200,它也不会丢弃任何数据。守则如下:from
scrapy
.spider import BaseSpiderfrom
scrapy
.selectorimport HtmlXPathSelector from
scrapy
.contrib.spiders import CrawlSpider, R
浏览 3
提问于2013-05-31
得票数 5
2
回答
如何获得一个具有精确的web抓取类名称的值
、
您可以看到,某些类具有:
js
-变量,而有些类禁用
js
-变体。但是这不能正常工作,并且给出了所有的值,即使是在其中禁用了类的值。
浏览 4
提问于2022-11-01
得票数 0
回答已采纳
1
回答
如何使用
scrapy
从页面中提取所有href内容
、
我想使用
Scrapy
从一个给定的网站获得所有链接。我正试着这样做-import unidecodefrom
scrapy
.linkextractorsimport LinkExtractor name = 'linkdataparse(self, r
浏览 3
提问于2016-10-07
得票数 2
回答已采纳
1
回答
无法锻炼如何让css选择器在刮刮中刮擦
、
、
、
我正在努力刮这个,并且我很难理解css选择器与
Scrapy
一起工作。css css:.css-truncate-target .messagetime-ago.css-truncate-target .message::texttime-ago::textimport
scrapy<
浏览 3
提问于2017-12-03
得票数 1
回答已采纳
1
回答
如何在javascript文件中执行
scrapy
python?
、
、
我有一个用命令
scrapy
crawl mynamefile启动的python脚本。我想从我的node
js
应用程序的
js
文件中运行python cli命令
scrapy
crawl,然后在控制台中显示它。 问题是我不知道如何在节点中导入
scrapy
python库。 谢谢你的帮忙!
浏览 24
提问于2019-03-07
得票数 0
1
回答
为什么
Scrapy
中的数据没有完全加载视图(响应)?
、
我正试着用
Scrapy
从Youtube上收集一些评论。但是,当我进入
scrapy
shell模式并使用view(response)打开它时,除了加载旋转器之外,我找不到任何注释。
scrapy
shell https://www.youtube.com/watch?v=kkl7-NzqxWo在注释部分显示无限旋转器。
浏览 1
提问于2018-12-01
得票数 0
回答已采纳
2
回答
无法使用刮伤认证fandromeda
、
、
import
scrapy
from
scrapy
.http import Request, FormRequestfrom fandromeda.items import FandromedaItem class FandromedaC(CrawlSpider我注意到,在默认情况下,
scrapy
正在发出get请求而不是post。
scrapy</
浏览 4
提问于2016-12-01
得票数 0
回答已采纳
1
回答
未在PythonAnywhere.com上启用刮擦项管道
、
、
、
、
│ ├── bootstrap.bundle.min.
js
│ │ │ ├── bootstrap.
js
│ │ │ ├── bootstrap.min.
js
│ │ │ └── bootstrap.min.
js
浏览 21
提问于2019-03-17
得票数 2
回答已采纳
1
回答
用
JS
流行Python刮取数据
、
、
我想知道,我们能否从使用Python生成的页面上弹出的弹出中刮取特定字段的数据?如果是,请建议。
浏览 5
提问于2017-02-10
得票数 0
1
回答
基于邮编的动态数据提取方法
、
、
、
、
我对
Scrapy
很陌生,通过一些教程,我可以刮几个简单的网站,但我现在面临一个新网站的问题,在那里我必须填写一个搜索表格并提取结果。我得到的回应没有结果。
浏览 0
提问于2013-07-25
得票数 2
回答已采纳
1
回答
无法获取
scrapy
javascript完整响应
、
、
、
、
这是我的python代码(我正在用docker run -p 8050:8050 scrapinghub/splash运行splash docker ) import
scrapy
import
scrapy
_splash class Covid_Spider-- Global site tag (gtag.
js
) - Go
浏览 10
提问于2020-04-01
得票数 0
回答已采纳
1
回答
试图确定为什么我的xpath在
Scrapy
中失败
、
、
我可以编写一个xpath表达式,它可以在我的浏览器中工作:但是当我尝试使用
Scrapy
外壳时: response.xpath("//*/section/div
浏览 8
提问于2021-08-23
得票数 0
回答已采纳
1
回答
带有MongoDB的刮伤管道不起作用
、
、
init.py class RsdataSpider(
scrapy
.Spider//h2/span[@class="property-card__title
js
-cardLink
js
-card-title"]/text()').extract_first()//span[@class="pr
浏览 0
提问于2021-08-18
得票数 0
回答已采纳
1
回答
Scrapy
& Splash没有从javascript页面返回任何内容
、
、
from
scrapy
_splash import SplashRequest name = 'jsdemo'def start_request(self): url = 'http://quotes.toscrape.com/
js
爬行jsdemo‘一起运行的(我已经在本地虚拟环境中安装了
scr
浏览 0
提问于2018-05-11
得票数 0
回答已采纳
2
回答
在
Scrapy
响应中执行内联JavaScript
、
、
、
、
我试图用
Scrapy
登录一个网站,但收到的响应是一个只包含内联JavaScript的超文本标记语言文档。
JS
重定向到我想要从中抓取数据的页面。但是
Scrapy
不执行
JS
,因此不会路由到我想要的页面。'request_id': request_id, }print
浏览 72
提问于2017-06-22
得票数 3
2
回答
使用
Scrapy
Splash将响应存储为文件
、
、
、
、
import
scrapy
author =
scrapy
.Field= ["http://quotes.toscrape.com/
js
/"] for url in self.start_urls\tutorial\spi
浏览 5
提问于2020-10-14
得票数 4
回答已采纳
1
回答
为什么刮痕不发送正确的url?
、
、
、
、
parse: url = 'http://quotes.toscrape.com/
js
=0.8", "Accept-Language": "en"}, "html": 1, "png": 0, "url": "http://quotes.to
浏览 4
提问于2020-08-02
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
scrapy(一)scrapy 安装问题
Python Scrapy 爬虫(二):scrapy 初试
Scrapy框架的使用之Scrapy入门
Scrapy框架的使用之Scrapy通用爬虫
Scrapy向导
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券