腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
使用
Scrapy
自动
获取
请求
头
?
、
然后可以将这些标
头
添加到
Scrapy
请求
中。{b'Accept': [b'text/html,application/xhtml+xml,application/
浏览 50
提问于2021-05-21
得票数 0
回答已采纳
1
回答
如何
在python
scrapy
中
获取
请求
头
、
如何
在python
scrapy
中
获取
动态表数据的
请求
头
?有没有一种方法可以在不
使用
点击模拟的情况下获得数据?
浏览 0
提问于2020-04-04
得票数 0
1
回答
如何
在
scrapy
spider运行时
获取
新的令牌
头
、
、
我正在运行一个抓取蜘蛛,它首先从我抓取的网站
获取
授权令牌,
使用
基本
请求
库。用于此的函数称为get_security_token()。此令牌作为标
头
传递给
scrapy
请求
。爬行器是否可以看到401错误,再次运行get_security_token()函数,然后将新的令牌传递给所有未来的
请求
头
?import
scrapy
name = 'p
浏览 12
提问于2020-08-04
得票数 0
1
回答
抓取跟随javascript输入按钮
、
、
、
我已经尝试了下面的代码,只是看看是否有
scrapy
跟随输入,但没有成功。links = sel.xpath("//input[@class='GetData']").extract() yield
scrapy
.FormRequest.from_response
浏览 1
提问于2016-01-21
得票数 3
回答已采纳
2
回答
如何
在刮伤中验证Yelp API?通过Secret_Token和搜索?
、
、
、
下面是我在
Scrapy
日志中抛出400错误的代码。这段代码背后的逻辑如下- 1)我
使用
post
请求
来
获取
我的Secret_Token。2)将
头
设置为
使用
秘密令牌,并为API搜索字符串定义参数。我还认为,对于进一步的
请求
,应该将带有Secret_token的
头
作为元数据传递。3)在这里,我期望Parse函数在#2中接收来自
请求
的json响应,并将其解析为items。在该循环之后,在Parse方法中列出准备和工作
请求
#2
浏览 2
提问于2017-03-06
得票数 1
回答已采纳
2
回答
Scrapy
:在一个
请求
失败的情况下(例如404,500),
如何
请求
另一个替代
请求
?
、
、
、
我对
scrapy
有意见。在一个
请求
失败的情况下(如404,500),
如何
请求
另一个替代
请求
?如两个链接可以
获取
价格信息,其中一个失败了,另一个
自动
请求
。
浏览 1
提问于2013-06-04
得票数 8
回答已采纳
1
回答
将刮伤改为刮红后,启动url
头
改变。
、
我有一个刮伤项目,我想将它修改为
scrapy
:主要的刮伤文件如下: name = 'ScrapyBot' callback=self.parse}该
请求
在
Scrapy
中运行良好,但在添加
scrapy
-redis部件后,开始
请求
中的
浏览 2
提问于2022-03-29
得票数 0
1
回答
抓取分页XHR 400坏
请求
、
、
、
我正在尝试从https://www.magzter.com/magazines/listAllIssues/503中
获取
所有的urlhttps://www.magzter.com/magazines/listAllIssues/503/12 https://www.magzter.com/magazines/listAllI
浏览 7
提问于2017-09-24
得票数 0
回答已采纳
1
回答
在
Scrapy
框架中发送post
请求
,它不工作,但在python
请求
中工作,显示403个错误
、
、
我面临一个与POST API中的
scrapy
框架相关的问题。我是通过python
请求
完成的,但我不理解
scrapy
框架的问题。我只想把api数据保存在我的系统中,这样我就可以访问所有的酒店名称。我认为该网站正在
使用
一些反刮措施。蜘蛛: name = 'm' 'COOKIES_ENABLED
浏览 10
提问于2022-02-02
得票数 0
1
回答
如何
打印
Scrapy
发送的
请求
头
?
、
、
我想要做的任务是打印
scrapy
发送的
请求
头
。我在
如何
使用
scrapy
中间件方面遇到了一点困难。 我在项目settings.py文件中激活了下载器中间件。谁能告诉我
如何
激活那个特定的功能?或者,是否有其他方法可以打印
请求
标
头
?
浏览 21
提问于2021-05-31
得票数 1
1
回答
在heroku上部署
scrapy
项目
、
、
、
我有一个抓取蜘蛛项目,它报废了一些网站,并
获取
我的数据上。我的爬行器生成两个JSON文件,所有抓取的数据都存储在这两个文件中。现在,我有一个flask web服务,它
使用
上述两个JSON文件来满足用户的
请求
。我想
自动
化这个过程,即
scrapy
项目应该每天运行,产生的JSON文件应该
自动
更
浏览 1
提问于2014-04-24
得票数 2
1
回答
Selenium,
Scrapy
迭代(单击下一步)仅从第一页提取项目的href
、
、
要转到下一页,我
使用
next_click()。Selenium webdriver将打开并单击所有页面(到目前为止还不错)。但只提取第一页中的项。这是5倍(与页面的数量一样多)。import
scrapy
import timefromselenium import webdriver name
浏览 2
提问于2020-11-05
得票数 0
2
回答
Scrapy
支持JavaScript进行网络爬行吗?
、
、
、
我听说
scrapy
不支持javascript。我想知道我是否可以
使用
scrapy
抓取我们内部网站的链接,我们的内部网站有javascript,我相信当你点击一个链接时它就会生成,但我不是100%确定。但视图源是由xml-stylesheet组成的,当我
使用
firebug时,它的数据与html相同。我也不能
使用
html标记来抓取站点,我需要
使用
xml标记才能抓取。我知道我可以
使用
xml标记抓取第一个页面,但是我能继续跟踪链接并继续抓取吗? 我还能不能用
scrapy
浏览 2
提问于2013-07-16
得票数 0
1
回答
如何
利用
Scrapy
对非Selenium
请求
的并发性
、
、
我正在写一个
Scrapy
网络刮板从网站上
获取
产品。目录页
使用
延迟加载,这意味着我不能获得超过前12个项目,也不能
使用
默认
Scrapy
分页。我已经开始在无
头
chrome客户端上
使用
Selenium,以便手动滚动页面以
获取
数据。我在网上读到,
使用
Scrapy
+ Selenium意味着我不能同时运行
Scrapy
请求
,这很不幸,因为我的绝大多数
请求
都不需要Seleniu
浏览 3
提问于2020-02-18
得票数 0
1
回答
如何
处理元素状态更改后的ajax响应?
、
、
、
就是这里 我想用
Scrapy
来截取它,但是我没有得到这个小字符串,而是得到了整个页面。
浏览 4
提问于2014-02-11
得票数 0
1
回答
scrapy
-splash返回它自己的标
头
,而不是站点的原始标
头
。
、
、
、
现在我需要的是维护会话,所以我
使用
scrapy
.downloadermiddlewares.cookies.CookiesMiddleware,它处理set-cookie
头
。我知道它处理set-cookie
头
,因为我设置了COOKIES_DEBUG=True,这会导致CookeMiddleware有关set-cookie
头
的输出。问题是:当我将splash添加到图片中时,set-cookie打印就会消失,而实际上,作为响应
头
,我得到的是{'Date':'Su
浏览 1
提问于2016-09-25
得票数 7
回答已采纳
1
回答
抓取外壳看起来不同于用户界面,网站的一部分是不可抓取的
、
、
、
、
如果我
使用
chrome devmode,我无法在xpath或选择器中复制正确的位置。
浏览 24
提问于2019-04-24
得票数 0
回答已采纳
1
回答
为
scrapy
shell
请求
设置标
头
、
我知道你可以通过
scrapy
shell -s USER_AGENT='custom user agent' 'http://www.example.com'来改变USER_AGENT,但是
如何
添加
请求
头
呢
浏览 1
提问于2016-05-04
得票数 20
回答已采纳
1
回答
无法抓取Javascript网站- API调用/ XHR
请求
、
、
、
、
我需要从
使用
XHR
请求
发送到服务器的API调用中
获取
学校列表,该
请求
获取
JSON对象 我
使用
与XHR
请求
相同的
请求
头
,包括Cookie值。不确定为什么它不工作。它基本上会给出超时错误。附加来自google chrome
请求
标题(网络选项卡)的Python代码和屏幕截图,以及来自vs代码术语的错误: # -*- coding: utf-8 -*-importjson c
浏览 24
提问于2020-11-24
得票数 0
1
回答
从需要headers={“用户代理”、“cookie”、x-xsrf-token'}的主机
获取
json数据。
、
、
、
有一个包含json数据集的服务器,我需要一个json数据集,我需要'user-agent'I ,我可以手动
使用
登录到url,并
使用
chrome developer工具来读取上述json data 的
请求
头
我确定,应该发送到json端点的最低要求的
头
是'cookie‘、’xsrf token‘、不知道
如何
获得这些值,这样我就可以
自动
获取
这些数据。我想
使用
请求
模块
获取
我尝试
浏览 9
提问于2019-11-14
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何优雅地复制请求头
如何使用Python异步请求
HttpWatch使用-如何获取HWL文件
使用 SpringAOP 获取一次请求流经方法的调用次数和调用耗时
Mastercam如何使用侧铣头
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券