腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
Scrapy
正在
尝试
获取
Json
响应
、
我
正在
使用刮刀刮掉steam游戏平台,并且我在分页方面遇到了问题。我想用
Scrapy
的FormRequest函数来模拟这个请求,并一次性获得所有的评论。我不知道该怎么做。我的头和表单数据应该是什么样子的?如何设置我的FormRequest以
获取
所有注释(在本例中为1-134)?
浏览 1
提问于2021-06-25
得票数 1
2
回答
Scrapy
:从get请求中抓取数据
、
、
、
、
我
正在
尝试
用
scrapy
从中抓取数据。但是当我在shell中
尝试
view( response )时,一些
响应
丢失了。当我打开chrome dev工具时,我分析了网络,并意识到我
正在
搜索的数据来自get请求,其中对它的
响应
是一个包含我需要的数据的
json
文件。但是请求失败的原因是 有没有办法在
scrapy
中手动执行get请求来
获取
json
文件?
浏览 38
提问于2019-08-10
得票数 0
回答已采纳
1
回答
Python requests.post的刮伤版
、
、
、
我
正在
对特定端点执行请求,使用python请求添加一些头和
json
。但是,由于我
正在
编码的存储库的体系结构是基于
scrapy
的,所以我想提出相同的请求,但要翻译为
scrapy
json
_data = { 'page_size=
json
_data)我想要的答复(简单地说,因为原来的更大) ...
浏览 5
提问于2022-10-11
得票数 0
2
回答
为什么我不能在
Scrapy
中解析
响应
?
我得到了200条HTTP消息,这意味着
响应
将成功返回。但是我不能解析
响应
,尽管xpath查询是正确的。有谁可以帮我?谢谢。这是代码:name = 'lazada' allowed_domains = ['lazada.com.myUPDATE:我确实
尝试
过
获取
存储在javascript中的数据,或者使用selenium来模仿人类的浏览行为,但是在
尝试
浏览 19
提问于2020-10-28
得票数 0
1
回答
XHR请求预览显示
响应
中不存在的数据
、
、
我
正在
尝试
使用拼搏从一个公共网站上
获取
一些数据。谢天谢地,数据主要可以在以下xhr请求中找到: 但是,当我双击查看实际
响应
时,search_results项中没有数据:我只是想知道请求是怎么回事,我如何访问这些数据,目前我试着喜欢这个,但显然它没有从
响应
中
获取
任何数据。import
scrapy
name = "whi
浏览 6
提问于2022-09-11
得票数 1
回答已采纳
1
回答
Scrappy选择器上的Scrappy迭代
、
、
、
、
我
正在
尝试
抓取一个使用调用HTML的API的网站,因此为此,我需要抓取API,然后从API抓取HTML结果 我已经使用这篇文章设法获得了API
响应
,并从中获得了HTML。resp =
json
.loads(response.text) selector=
scrapy
.Selector(text=resp['results'], type="html") 而且它工作得很好,当我试图从页面
获取
属性时,我可以使用CSS或Xpath选择器来
获取<
浏览 10
提问于2020-12-16
得票数 1
2
回答
XHR请求拉取大量HTML内容,如何抓取/抓取?
、
所以,我
正在
尝试
抓取一个无限滚动的网站。我遵循了这个关于无限滚动网页的教程:https://blog.scrapinghub.com/2016/06/22/
scrapy
-tips-from-the-pros-june-2016 但是给出的示例看起来非常简单,它是一个有序的
JSON
对象,其中包含您想要的数据。www.bahiablancapropiedades.com/buscar#/terrenos/venta/bahia-
浏览 38
提问于2019-02-24
得票数 0
回答已采纳
1
回答
Python
Scrapy
-
尝试
从RESTful API
获取
JSON
响应
、
、
、
我希望从我查询的RESTful应用程序接口获得
JSON
响应
。我输入了URL,但得到的只是一个HTML
响应
,而不是
JSON
。如果我能直接得到
JSON
响应
就好了,而不必解析所有的HTML。注意:当我将URL放到浏览器中时,它会给出一个HTML站点,其中的
JSON
数据是一种漂亮的、可折叠的格式。当我使用Python requests模块发送GET请求时,它会给出
JSON
数据。如何在
Scrapy
中实现相同的功能?
浏览 1
提问于2017-05-06
得票数 0
1
回答
Scrapy
使用了错误的编码,从网页向
JSON
添加了额外的html标签
、
、
、
、
所以我想使用
Scrapy
来
获取
{ "data": { ...但是,
Scrapy
中的response.text对象使用不同的编码: "<div class="\"iblock\"">\
浏览 2
提问于2017-02-06
得票数 1
回答已采纳
2
回答
从
json
响应
中提取数据
、
、
我
正在
尝试
使用
scrapy
从
json
响应
中提取数据。目的是使产品在答复中列出:eimport
json
name = 'depop' allowed_domains1645&itemsPerPage=24&country=gb¤cy=GBP&sort=relevance
浏览 19
提问于2021-12-20
得票数 0
回答已采纳
1
回答
无法使用
scrapy
解析
json
的不同ids,而我通过请求获得成功。
、
、
、
、
我试图使用
scrapy
解析来自某些
json
响应
的不同I,但我无法做到这一点,尽管我使用请求模块获得了成功。我试图从这个中
获取
不同的ids。Ids看起来像1397099,539728 e.t.c,它的请求版本可以毫无瑕疵地
获取
。()['Products']:使用刮伤(失败):import
json
from urllib.parse import代码
浏览 3
提问于2020-07-18
得票数 0
回答已采纳
2
回答
外壳和蜘蛛中的
Scrapy
处理ajax连续
响应
数据
、
、
、
、
我
正在
尝试
在ajax请求之后抓取加载的数据。
scrapy
shell https://www.youtube.com/user/testedcom/videos
浏览 1
提问于2015-10-24
得票数 1
1
回答
Scrapy
反应的不恰当编码
、
、
、
、
当我昨天试用
Scrapy
时,我
正在
尝试
获取
一个中国Ruby论坛的帖子的标题。但是,不知何故,
Scrapy
的输出都是Unicode,如下所示我已经检查了
响应
的编码为UTF因此,我搞不懂为什么我使用
Scrapy
选择器来选择标题并将输出放到
Json
文件中。然后,文件内容都是字符指针,就像\u5317一样。任何帮助都将不胜感激。
浏览 3
提问于2017-05-23
得票数 1
2
回答
python/
scrapy
用于动态内容
、
我
正在
尝试
编写一个python/
scrapy
脚本,以便从获得一个广告列表,我对
获取
单个广告的urls感兴趣。我发现该页面
正在
向发出XHR请求。
尝试
编写刮擦的shell脚本来
尝试
我的想法:url = 'https://www.donedeal.ie/search/api/在Chrome工具中,我看到这样的请求给出
浏览 4
提问于2015-10-17
得票数 1
回答已采纳
1
回答
如何通过使用刮伤获得所有的img?
、
、
试着在刮破的壳里做 >>>
scrapy
shell 'https://www.trendyol.com/trendyolmilla/cok-renkli-desenli-elbise-twoss20el0573
浏览 2
提问于2021-06-24
得票数 0
回答已采纳
1
回答
在刮取
Scrapy
时,每个URL的HTTP
响应
代码
、
、
、
、
被刮掉的URL数量和获得200个
响应
状态的URL数量是不一样的。另外,我想得到的URL与他们各自的反应。我
正在
使用
Scrapy
抓取70000个URL,同时希望通过
Scrapy
获取
每个URL的HTTP
响应
状态,以便在
获取
特定URL的内容之后,我们还将获得该URL的
响应
代码:如何获得相应URL的
响应
代码?
浏览 1
提问于2018-09-03
得票数 0
1
回答
如何抓取
JSON
网页
、
、
嘿,所以我有一些抓取html的经验,但从不使用
json
,所以我需要使用
scrapy
,来抓取下面的网页,并且我在网上找到了一个教程,它使用
scrapy
和jmspath从web上刮取
json
数据。items.py """User item definition for jsonplaceholdername =
scrapy
.Field()
浏览 0
提问于2019-06-28
得票数 2
回答已采纳
2
回答
Webscraping:没有任何数据显示在刮除
、
、
、
我
正在
尝试
爬行这个,但是我得到了空
响应
,我使用了
scrapy
,我
尝试
了打印xpath,但是我得到了空数组,虽然这是一个直接的任务,但是现在我无法从表中
获取
数据。这是我的密码。import
scrapy
name = 'share'
浏览 16
提问于2022-11-14
得票数 1
回答已采纳
1
回答
使用
Scrapy
,我不能因为未知的原因抓取网站(可能是因为某种重定向)
、
我
正在
使用
Scrapy
来抓取ntry.com它的主页的url是ntry.com/#/main.php,但出于一个我不知道的原因,我不能刮错一页。这是我的代码。import
scrapy
name = "ntry"start_urls
浏览 0
提问于2016-11-20
得票数 0
2
回答
AttributeError:“Response”对象没有python的“body_as_unicode”
scrapy
属性
、
、
、
我
正在
处理
scrapy
中的
响应
,并不断收到这条消息。f
浏览 1
提问于2015-07-27
得票数 3
回答已采纳
点击加载更多
相关
资讯
Scrapy尝试,获取斗图
scrapy官方文档提供的常见使用问题
如何利用Python网络爬虫抓取微信朋友圈的动态
从零开始学Scrapy:一步步教你掌握Python最强大的爬虫框架,轻松实现网页数据抓取!
如何利用Python网络爬虫抓取微信朋友圈的动态(上)
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券