腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(3050)
视频
沙龙
1
回答
如
何在
python
中
发送
带有
scrapy
或
request
的
if-none-match
头部
?
、
、
、
我正在用
Scrapy
抓取一个站点,但它
的
一些API没有返回JSON数据,而没有'
if-none-match
‘头。 我有超过100个API
的
列表,所以我想生成自动
的
头文件来获得一个有效
的
JSON文件。
浏览 27
提问于2020-10-21
得票数 1
1
回答
如果资源是在初始请求
中
获得
的
,是什么使条件获得“条件”?
、
、
、
、
分解条件获取
的
内容: 在
中
,如果请求消息包含If-* (If-Modified-Since、If-Unmodified-Since、If-Match、
If-None-Match
或
If-Range)
头部
字段例如,如果一个GET请求返回一个
带有
Etag头
的
响应,那么下一个请求必须包含
带有
ETag值
的
If-None-Match
,以将客户机传输回所请求
的
资源。但是,如果客户端在获得返回
的
&
浏览 3
提问于2015-11-12
得票数 2
回答已采纳
2
回答
"304 Not Modified“到底是怎么工作
的
?
、
、
、
浏览器如何确定对HTTP请求
的
响应是否为304?是由浏览器设置
的
还是从服务器
发送
的
?如果由服务器
发送
,服务器如何知道缓存
中
的
可用数据,以及如何将304设置为图像?我
的
猜测,如果它是由浏览器生成
的
:{} console.log(is_modif
浏览 56
提问于2014-01-08
得票数 187
回答已采纳
2
回答
未收到报头抓取
的
ProxyMesh
、
、
、
我是
Scrapy
/ ProxyMesh
的
新手。当我在Proxymesh网站上看到我
的
带宽消耗,并且meta.proxy在我
的
日志
中
是正确
的
时,我对ProxyMesh服务器
的
请求似乎正在工作。但是,当我在
Scrapy
中
记录响应头时,我没有收到我应该收到
的
X-Proxymesh-IP。这是我
的
代码。我做错了什么?') self.proxy_ip = 'http:
浏览 0
提问于2017-10-19
得票数 0
1
回答
Python
Spider ConnectionError:(‘连接中止。’,BadStatusLine("''",))
、
、
我正在使用
python
-
scrapy
执行爬行过程。我已经尝试了几种解决方案,比如使用
带有
随机用户代理和没有引用
或
代理
的
头部
,就像在其他一些帖子
中
推荐
的
那样,但爬虫总是失败。引发
的
错误是: 018-06-08 16:05:34 [
scrapy
.core.scraper] ERROR: Spider error processing <GET https://www... >'A
浏览 0
提问于2018-06-08
得票数 0
1
回答
抓取-动态等待页面加载- selenium +
Scrapy
、
、
、
最近,我用
python
和Selenium制作了一个webscraper,我发现做起来非常简单。该页面使用ajax调用加载数据,并且我首先等待一个固定
的
time_out来加载该页面。有一段时间起作用了。我花了平均每页1.35秒
的
时间下载内容。1)
sc
浏览 5
提问于2017-09-18
得票数 3
回答已采纳
1
回答
如何从使用javascript扩展内容
的
页面
中
__scrape__所有信息?
、
、
我在试着刮具有元素列表和底部可增加列表
的
展开按钮
的
页面。它使用onclick事件进行扩展,但我不知道如何激活它。我正在尝试使用
scrapy
-splash,因为我读到它可能会工作,但我不能让它正常工作。我目前正在尝试做
的
事情是这样
的
: def expand_page(self, response): page =response.
request
.url if len(expa
浏览 26
提问于2020-08-03
得票数 1
回答已采纳
2
回答
如何让浏览器知道文件已经更新?ASP.NET MVC
、
我有一个IIS网站托管在ASP.NET
中
。有时我推送更改,用户
的
浏览器可能仍然使用以前
的
文件,导致功能问题。这是因为浏览器正在缓存这些文件,对吗?如何确保用户浏览器加载更新后
的
文件?? 谢谢!
浏览 4
提问于2010-06-10
得票数 0
回答已采纳
2
回答
Python
yield和return语句?和
Scrapy
产生
的
请求
、
当我们在生成器
中
yield任何值
或
请求时,实际发生了什么?for index in range(3):这是在特定
的
url上发出请求,并在请求之后调用回调函数。代码所遵循
的
顺序是什么?
浏览 1
提问于2012-01-09
得票数 7
1
回答
我应该在收到304后关闭代理连接吗?
、
、
、
、
就像浏览器一样),并且它传递了一个if-modified-since
或
if-none-match
(或者其他任何东西)
头部
,导致第三方服务器使用304状态代码进行响应。现在,从技术上讲,服务器不应该
发送
正文,而客户端在接收到304之后并不关心响应正文。对于错误地
发送
带有
304
的
响应体
的
服务器,在代理响应处理程序
中
执行此操作是否有意义(以及是否会节省带宽/资源): var proxyReq = http.
request
浏览 6
提问于2014-12-30
得票数 2
2
回答
运行结果很差
刚刚开始使用
Scrapy
,我希望能在正确
的
方向上有所作为。我想从这里抓取数据: import
scrapy
name = 'sportstatsresults.append(result) print(result) 现在我需要转到下一个页面,我可以在浏览器
中
通过单击
浏览 2
提问于2016-05-12
得票数 0
1
回答
使用
scrapy
从网站返回值
、
、
、
我正在使用
Python
中
的
scrapy
,试图从网站
中
获取一个值,然后用于迭代。我遇到
的
问题是,它似乎只能
发送
请求超过产量,这使得它不可能得到一个值返回。class Spider(
scrapy
.Spider): allowed_domains = ['domain.com']
浏览 0
提问于2014-12-08
得票数 1
回答已采纳
2
回答
请求和aiohttp之间不同
的
网页内容
、
、
、
、
不幸
的
是,在切换到aiohttp后,网站构建
的
角度给我
的
响应没有动态内容。所以,我有两个问题 如何用aiohttp修复代码以获得适当
的
内容?
浏览 5
提问于2020-01-08
得票数 1
回答已采纳
4
回答
如何使用
python
urllib2
发送
json数据进行登录
、
、
我想使用
python
来模拟登录操作,我使用urllib2捕获数据包,得到登录操作只是一个ajax请求,用户名和密码是作为json数据
发送
的
,但我不知道如何使用urllib2
发送
json数据,帮助...
浏览 1
提问于2010-12-04
得票数 16
回答已采纳
1
回答
我如何给UHD: USRP源一个命令,改变中心频率后,一些样本?
、
、
、
我需要
发送
一些数据从一个文件跳频USRP接收器和接收由USRP源。两种方法都必须在采样量过大后,同步并不断地改变频率。我如何判断(特别是)
python
代码
中
的
USRP源代码来改变频率?is 'freq' => sets the frequency); //现在将“命令”传递到USRP块
的
命令端口听起来像是改变它
的
方法。以及如<
浏览 0
提问于2019-01-16
得票数 0
5
回答
如何
发送
带有
粗糙CrawlSpider请求
的
cookie?
、
、
、
我正在尝试使用
Python
的
框架来创建这个刮刀器。所以,我一直试图
发送
一个饼干,每一个请求蜘蛛提出,但,这是不可行
的
。这里有人能告诉我怎么做吗?或者我做错了什么?fr
浏览 0
提问于2015-09-17
得票数 22
回答已采纳
1
回答
如何构建一个独立
的
Scrapy
Spider?
、
、
很抱歉转载,我之前帖子
的
标题令人困惑。在爬行器示例(下面的代码)
中
,我如何使用"pyinstaller“(
或
其他安装程序)来构建可执行文件(
如
myspidy.exe),以便最终用户不需要在windows环境
中
安装
scrapy
和
python
?安装了
Python
和
Scrapy
之后,可以通过执行命令"
scrapy
crawl quotes“来运行爬行器。最终用户会在没有预装
Python
浏览 0
提问于2018-05-16
得票数 1
2
回答
如何理解
scrapy
.
Request
中
的
回调函数?
、
、
我正在使用
Python
第二版阅读Web抓取,并希望使用
Scrapy
模块从网页
中
抓取信息。 传递用于数据解析<
浏览 4
提问于2020-07-04
得票数 0
回答已采纳
2
回答
第一次运行后刮掉
的
'twisted.internet.error.ReactorNotRestartable‘错误
、
、
、
、
我正在使用CrawlerProcess从脚本
中
运行
Scrapy
(版本1.4.0)。Urls来自用户输入。58:46 [
scrapy
.statscollectors] INFO: Dumping
Scrapy
stats: 'downloader/
python
/crawlerapp/appenv/lib/
python</e
浏览 3
提问于2017-07-17
得票数 3
1
回答
将图像下载到绝对路径
、
,imageName)如何创建管道来将图像存储在我创建
的
绝对路径
中
,我检查了,但找不到改变存储位置
的
方法。注意:我更喜欢和
scrapy
在一起,而不是用requests下载图片。
浏览 0
提问于2020-03-12
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
教你分分钟学会用python爬虫框架Scrapy爬取心目中的女神
Python爬虫-Scrapy入门
Python中爬虫框架或模块的区别
scrapy官方文档提供的常见使用问题
python爬虫-Scrapy入门
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券