腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
Web-Scraping
:
使用
Scrapy
移
动到
下一
页
以
获取
所有
数据
、
、
我需要在亚马逊上抓取一个产品的
所有
评论: import
scrapy
from
scrapy
.cr
浏览 7
提问于2020-08-03
得票数 1
1
回答
当页面是事件时,在页面之间移动
、
scrapy
shell 'https://www.forever21.com/us/shop/catalog/category/f21/sale_women'#next_page = 你好,我试图在页面之间移动但是,页面是“事件”,它只是添加"#pageno=2&pageSize=120&filter=price:0,250“当转到
下一
页<
浏览 2
提问于2019-10-24
得票数 0
回答已采纳
2
回答
我如何从有
下一
个按钮的网站刮擦,如果它滚动?
、
我正试着从一个叫做商示波器的网站上搜集
所有
的
数据
。但是,当我试图运行我的代码时,它只是得到一个随机引用。它至少应该从那个页面中
获取
所有
的
数据
,但它只需要一个。另外,如果我从第1
页
得到
数据
,我想要的是从
所有
页面中
获取
数据
。 如何
使用
下一
页
中的
浏览 0
提问于2019-04-15
得票数 0
1
回答
如何在python中
使用
selenium或
scrapy
点击“
下一
步”按钮
、
、
、
、
我正在尝试
使用
scrapy
从flipkart.com中抓取一些
数据
。除了翻到
下一
页
,我什么都拿到了。首先,我尝试
使用
scrapy
,然后
使用
selenium。实际上,一个类有上一
页
和
下一
页
的两个链接。
使用
scrapy
:我无法
获取
任何结果。我得到的是空白输出。
使用
selenium:每当我尝试点击
下一
页<
浏览 45
提问于2021-02-10
得票数 1
1
回答
无法从
scrapy
中的
所有
页面
获取
数据
、
、
我不能
获取
所有
页面
使用
下面的代码,它只给出
数据
到第90
页
,然后显示分配错误。我正在
使用
下一
步按钮url移
动到
下一
页
。但是在第90
页
之后,它给出了我在下面提到的错误。运行以下代码: import
scrapy
name = 'pagination
浏览 7
提问于2020-10-15
得票数 0
1
回答
SCRAPY
分页:无限滚动分页
、
、
我正在尝试从中
获取
数据
。我已经设法从网站的第一
页
抓取了
数据
。我哪里做错了?
浏览 1
提问于2021-04-18
得票数 0
1
回答
如何在
Scrapy
中有条件地重试和重新整理当前页面?
、
、
我是
Scrapy
的新手,对Python也不是很熟悉。我已经设置了一个抓取器来从网站上抓取
数据
,但是虽然我
使用
的是代理,但如果同一个代理被
使用
太多次,那么我的请求就会显示一个页面,告诉我访问太多页面太快(HTTP状态代码200)。因为我的抓取器看到的是页面的状态代码为on,它找不到所需的
数据
并移
动到
下一
页
。 我可以确定何时通过HtmlXPathSelector显示这些页面,但是我如何通知
Scrapy
重试该页面呢?
浏览 1
提问于2013-03-25
得票数 3
回答已采纳
2
回答
scrapy
-来自以下页面的
数据
移
动到
下一
页
后如何下载
数据
?它只从第一
页
下载。我粘贴我的代码: # -*- coding: utf-8 -*-from
scrapy
.http import Request yield Request(absolute_next_page_url) 我只从第一
浏览 25
提问于2019-03-21
得票数 0
回答已采纳
1
回答
使用
scrapy
获取
“
下一
页
”
数据
、
、
我需要抓取商品网站的评论
数据
,但它的用户
数据
是分页的,每页的.The评论是10条,大约有100
页
。我怎么才能把他们都爬出来?下面是关于“
下一
页
”链接的Html代码: <div class="Pagecon"> <div class
浏览 4
提问于2014-11-06
得票数 0
回答已采纳
1
回答
使用
残缺的规则访问“
下一
页
”
、
、
、
代码的目标是抓取一些亚马逊产品的
数据
,它是这样工作的: 让我们
以
这个页面为例 https://www.amazon.com/s?k=mac+makeup&crid=2JQQNTWC87ZPV&sprefix=MAC+mak%2Caps%2C312&ref=nb_sb_ss_i_1_7 代码所做的是输入该页面的每个产品并从中
获取
数据
,在完成从该页面中抓取
所有
数据
后,它将移
动到
下一
个页面(在本例中为第2
浏览 2
提问于2019-06-04
得票数 0
2
回答
XHR请求拉取大量HTML内容,如何抓取/抓取?
、
我遵循了这个关于无限滚动网页的教程:https://blog.scrapinghub.com/2016/06/22/
scrapy
-tips-from-the-pros-june-2016 但是给出的示例看起来非常简单,它是一个有序的JSON对象,其中包含您想要的
数据
。在过去,我已经成功地
使用
正常的分页和由xpath指导的规则完成了这项工作。
浏览 38
提问于2019-02-24
得票数 0
回答已采纳
1
回答
在jquery的pageshow事件中调用web api
、
、
、
我的index.html中有三个
数据
页
。我在第一
页
的data-page的pageshow事件中调用一个web api,并填充列表视图。然后,通过点击该列表,itam
获取
该列表项的id并移
动到
下一
页
,并再次调用web api
以
在页面显示事件中
获取
该列表项的详细信息。然后,我再次从详细
页
转到第3
页
,
以
调用另一个api。这一切都工作得很好,但问题来了,当我移
动到
详细<e
浏览 3
提问于2013-11-06
得票数 0
1
回答
抓取爬行器不会从
所有
页面收集
数据
。
、
、
我正在
使用
Scrapy
BaseSpider从一个网站收集
数据
。抓取器从产品展示页面开始,移
动到
“
下一
页
”链接,从每个页面收集某些
数据
,并将其存储到CSV文件中。爬行器运行正常,但仅从第1
页
、第2
页
和最后一
页
(第36
页
)收集
数据
。在对代码进行了几个小时的修补之后,我找不出原因。下面的代码显示了我的爬行器。有什么建议吗?from
scrapy
.spider impo
浏览 0
提问于2012-12-03
得票数 1
1
回答
Scrapy
Splash单击带有javascript href的链接
、
我正在
使用
Scrapy
Splash抓取一个包含如下元素的页面: 第1
页
,共349
页
1|2|3|4|5|6|7|8|9| 10 |
下一
步> 我想‘点击’锚与文本‘
下一
步’,并让javascript执行
以
获取
下一
页
。': None, '
scrapy
_fake_useragent.middleware.Rando
浏览 29
提问于2019-02-16
得票数 1
回答已采纳
1
回答
如何
使用
Java单击列表中的链接
、
、
、
、
我一直在努力为我的某个项目搜集
数据
。我在
使用
Selenium方面仍然是新手,但我已经能够完成基本的工作。我现在要做的是,程序单击上面的“
下一
步”链接,移
动到
下一
页
,
以
获取
更多的
数据
。请帮帮忙。
浏览 0
提问于2018-12-16
得票数 1
回答已采纳
1
回答
使用
Scrapy
从
下一
页
获取
数据
、
、
这个想法是收集
所有
网页上
所有
房产的价格和一般信息。当我在Jupyter Notebook中
使用
Scrapy
框架时,这是我到目前为止的代码: name = "quotes"#'pictures': quote.css('div.carousel__item-wrapper::text').extract()[2]这段代码在第一
页</em
浏览 4
提问于2020-03-12
得票数 0
2
回答
我想通过属性来标识特定的urls,但是如果感兴趣的属性是外文字符呢?
、
、
我想
使用
Scrapy
来递归地刮取
数据
--在
下一
个页面之后从一个页面中抓取
数据
。我的蜘蛛需要遵循“
下一
页
”按钮。原则上,response.xpath("a[@title = 'next page']")可以识别“
下一
页
”urls。然而,由于网站是中文(),我
使用
的选择器命令是response.xpath("a[@title = '
下一
浏览 7
提问于2015-10-18
得票数 0
回答已采纳
1
回答
Scrapy
以
任意顺序提取
数据
。
、
、
、
、
有人可以告诉我为什么
scrapy
以
任意顺序提取
数据
。我正试着在这一
页
上涂鸦。这个想法是从上到下提取
所有
的
数据
仓库,然后转到
下一
页
并执行相同的操作。(至第20
页
) 我不知道为什么我只拿了一些房子,而且是按任何顺序。谢谢 from
scrapy
.item import Field,Item from
scr
浏览 10
提问于2019-06-26
得票数 0
1
回答
如何像iOS中的Pinterest应用程序一样刷新表格视图
、
我正在
使用
rest服务从服务器
获取
数据
。当我获得
所有
数据
后,我刷新表视图。我是一
页
一
页
地抓取
数据
,就像在Pinterest应用程序中一样,当表格视图
使用
滚
动到
达最后一行时,它会为
下一
页
抓取
数据
。但是如果你看一下Pinterest应用程序,它非常流畅,并且没有jerk (可能是他们
使用
滚动而不是表格),但在我的应用程序中,当
获取
<
浏览 4
提问于2014-08-18
得票数 0
2
回答
使用
scrapy
递归地爬行站点
、
、
这是我到目前为止基于编写的代码(原始代码根本不工作,所以我尝试重新构建它)from
scrapy
.linkextractorsimport LinkExtractorfrom
scrapy
.selector importHtmlXPathSelector from nettuts.items impor
浏览 2
提问于2015-12-28
得票数 8
点击加载更多
相关
资讯
Scrapy框架的使用之Scrapy入门
新手爬虫之创建第一个完整的scrapy项目
——Scrapy详解
Python 萌新-10分钟学会爬虫
6000 多款 App,看我如何搞定她们并将其洗白白
热门
标签
更多标签
云服务器
ICP备案
实时音视频
对象存储
云直播
活动推荐
运营活动
广告
关闭
领券