腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
Web
抓取
:
下一个
页面
以
Javascript
呈现
,
我
如何
使用
Scrapy
获取
它
、
、
、
、
我
一直在尝试
使用
Scrapy
https://www.remax.com/homes-for-sale/ny/new-york/city/3651000来
抓取
这个网站。
我
可以
获取
页面
上的内容,但不能转到
下一个
页面
,因为
它
似乎是用
javascript
呈现
的。
如何
做到这一点呢?
浏览 4
提问于2020-11-30
得票数 0
1
回答
如何
使用
scrapy
进行分页
、
我
有这个目标url:<ul class="pagination pagination-lg"><a hrefNext" class="xh-highlight"></l
浏览 1
提问于2018-07-02
得票数 0
1
回答
等待带有
scrapy
的加载
页面
、
我
正在尝试
使用
FormRequest
获取
网页内容
以
绕过表单。但问题是,在这个表单之后,有一个
页面
与加载栏,只有在这个栏是满后,网站显示
我
想要的内容。
scrapy
脚本在响应对象中给出了加载
页面
,而不是具有
我
想要的结果的最终网页。
我
能做些什么来解决这个问题?
我
认为,也许
我
需要设置一个计时器,让爬虫等待加载的
页面
完成他的工作。
浏览 1
提问于2015-07-10
得票数 0
2
回答
为什么
我
不能在
Scrapy
中解析响应?
我
是新的
抓取
和
使用
它从拉扎达网站刮数据。
我
得到了200条HTTP消息,这意味着响应将成功返回。但是
我
不能解析响应,尽管xpath查询是正确的。有谁可以帮我?谢谢。这是代码:name = 'lazada' allowed_domains = ['lazada.com.myUPDATE:
我
确实尝试过
获取
存储在
浏览 19
提问于2020-10-28
得票数 0
1
回答
抓取
不能
抓取
链接-- vnexpress网站评论
、
我
是
Scrapy
& Python的新手。
我
尝试从以下URL
获取
注释,但结果始终为null:from
scrapy
.spiders import Spider item['like'] = comment.xpath('//span[@class="txt_666 tx
浏览 4
提问于2016-05-12
得票数 0
回答已采纳
2
回答
Scrapy
、Selenium或机械化来
抓取
web
数据?
、
、
、
我
想从一个网站上
抓取
一些数据。
我
应该
浏览 1
提问于2014-01-06
得票数 11
1
回答
抓取
外壳看起来不同于用户界面,网站的一部分是不可
抓取
的
、
、
、
、
问题是
我
不能
抓取
网站的一部分。如果
我
使用
chrome devmode,
我
无法在xpath或选择器中复制正确的位置。
我
将获得其他选项卡或div的正确路径,例如正文标题:body > div.header.home-header > div 然而,当我试图获得包含
我
想要的信息的标签时,
我
只得到了:#htmlContent如果
我
手动编写
它
,
它
应该是:body > div.main.mai
浏览 24
提问于2019-04-24
得票数 0
回答已采纳
2
回答
Scrapy
:提取数据(css-selector)
、
、
我
正在尝试从这个
获取
数据(标题)。
我
的代码不能工作。
我
做错了什么?
scrapy
shell https://www.indiegogo.com/projects/functional-footwear-run-pain-free#/ response.css('.t-h3
浏览 1
提问于2020-08-03
得票数 0
1
回答
使用
scrapy
splash对
抓取
速度有显著影响吗?
、
、
、
、
到目前为止,
我
一直在
使用
scrapy
和编写自定义类来处理
使用
ajax的网站。但是,如果
我
使用
scrapy
-splash,据我所知,它会在
javascript
之后
抓取
呈现
的html,爬虫的速度会受到严重影响吗?
使用
scrapy
抓取
一个普通的html
页面
所需的时间与
使用
scrapy
-splash
抓取</em
浏览 3
提问于2018-04-18
得票数 12
回答已采纳
1
回答
Scrapy
脚本并不能在电子商务网站
页面
上获得所有的产品
、
我
对刮刮还很陌生,
我
正在尝试刮一个产品列表
页面
(来自: nordstromrack.com)。
我
使用
了几乎相同的脚本在其他网站上没有问题,但在这个网站上,
它
似乎只给我的前6项的网页,
我
想刮。
我
在同一个站点上
使用
了不同的
页面
,结果相同(Ex:)。
我
用刮壳看看我是否得到了不同的结果,但我只得到前6个链接。该
页面
源只显示6个链接以及。所以我有点搞不懂到底是什么问题。
我
在
浏览 1
提问于2018-07-11
得票数 0
回答已采纳
9
回答
BeautifulSoup和
Scrapy
crawler有什么区别?
、
、
、
我
想做一个网站,显示亚马逊和易趣产品价格的比较。其中哪一个会工作得更好?为什么?
我
对BeautifulSoup比较熟悉,但对
Scrapy
crawler不太熟悉。
浏览 323
提问于2013-10-30
得票数 146
回答已采纳
2
回答
Scrapy
crawler无法从多个
页面
爬行数据
、
、
、
我
正在尝试删除以下
页面
的结果: `import sys from
scrapy
.selector import HtmlXPathSelectorfrom
scrapy
.contrib.spiders import CrawlSpider,
浏览 1
提问于2013-06-01
得票数 1
2
回答
在
web
服务器上
使用
java内容的
抓取
、
、
我
想从一个显然
使用
javascript
生成表的站点(这个站点是oddsportal.com)中
抓取
内容。
我
看到
Scrapy
无法加载动态内容,
我
阅读selenium可以处理
它
,但我计划
使用
web
服务器。 有什么方法可以解析这个站点或
获取
动态请求并
使用
scrapy
解析
它
吗?例如,
我
想从这个
页面
导入完整的表,包括标题
浏览 3
提问于2016-01-28
得票数 1
回答已采纳
1
回答
Rasbperry Pi上的
Scrapy
和
Javascript
站点
、
、
我
试图
抓取
一个
页面
,这是由
javascript
修改后,在Raspberri Pi上
使用
Scrapy
的初始加载。
我
试图安装docker和scrapinghub/splash来渲染
页面
,然后再将其传递给
scrapy
,但我意识到Splash还不支持ARM。在Raspberry Pi上
使用
javascript
和
Scrapy
来
抓取
页面
还有其他选择
浏览 15
提问于2017-08-13
得票数 0
回答已采纳
2
回答
在Python代码中
获取
的HTML与显示的网页不同
、
、
、
我
最近开始用
Scrapy
学习
web
抓取
,作为练习,
我
决定从this url
抓取
一个天气数据表。 通过检查
页面
的XPath元素,
我
将其表复制到我的代码中,但在运行代码时只得到一个空列表。
我
尝试
使用
以下代码检查HTML中存在哪些表: from
scrapy
import Selectorimport pandas as pd url = 'https:dat
浏览 122
提问于2020-09-06
得票数 0
回答已采纳
1
回答
如何
在google的网络商店搜索结果上
抓取
动态生成的数据
、
、
、
、
我
想
抓取
一个网页,
它
显示了在谷歌的网络商店的搜索结果,该链接是静态的,为特定的关键字。问题是
我
无法
呈现
由
Javascript
代码生成的动态数据,
以
响应服务器。
我
尝试
使用
Scrapy
和
Scrapy
-Splash
呈现
所需的
页面
,但仍然得到相同的响应。
我
使用
Docker在端口8050
浏览 12
提问于2019-07-07
得票数 0
1
回答
如何
将
javascript
呈现
模块集成到
scrapy
中?
、
、
、
我
正在做一个网络
抓取
程序,但我遇到了一个问题,
使用
刮擦与
javascript
生成的内容。
我
知道
scrapy
不是为进行这种类型的
抓取
而构建的,但我一直试图
使用
或来完成
我
所需要的工作。但是,
我
无法让这两个模块中的任何一个正确地
使用
scrapy
。
我
的问题是,如果有人有一个最小的示例,他们可以显示
使用
scrapyjs或splash来
呈现
浏览 0
提问于2014-02-04
得票数 4
回答已采纳
1
回答
在搜索Google时转到下一页
、
、
、
我
正试着在网上搜索谷歌酒店上的酒店列表。然而,
我
找不到一种方法绕过谷歌的分页,因为URL几乎保持不变,只是有一些事情发生了变化。
我
想知道这里有没有人以前通过过这个问题?
我
已经成功地从第一页
抓取
了数据,但我需要为那里的每一页做这件事 请看下面
我
的当前代码。
我
已经注释掉了下一页的部分,因为
我
不知道
如何
让
它
工作 from bs4 import BeautifulSoupimport sy
浏览 10
提问于2019-12-18
得票数 0
2
回答
Python
Scrapy
动态网站
、
、
、
、
我
试图在
Scrapy
和xpath选择器的帮助下刮一个非常简单的网页,但出于某种原因,
我
的选择器在
Scrapy
中不工作,但它们在其他xpath实用程序中工作<select//select[@id="chapterMenu"]/option[@selected="selected"]/text()')
S
浏览 4
提问于2014-01-19
得票数 1
回答已采纳
1
回答
从报纸到txt的剥落
、
我
对
抓取
有点陌生,
我
需要为一份工作提取一些报纸信息,
我
尝试过一些教程,但没有一个像我预期的那样有效,目标是
获取
一个给定的url,提取关于前4个ou 5主题的信息(当我们点击链接时的内部信息)。
我
试着浏览链接,首先,
我
失败了,输出是空的,显示0爬行
页面
。import
scrapy
name = 'blogspider'
浏览 1
提问于2017-05-03
得票数 0
回答已采纳
点击加载更多
相关
资讯
常用Python爬虫框架汇总
Python技术:Scrapy架构介绍
大神教你十分钟写界面化爬虫,爬取百思不得姐美眉视频:附源码
Scrapy源码(1)——爬虫流程概览
教你分分钟学会用python爬虫框架Scrapy爬取心目中的女神
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券