腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
2
回答
如何
使用
scrapy
在
html
页面
中
查找
动态
id
、
、
、
我正在尝试获取
动态
创建的
html
标签
ID
的文本。我在那里,无论
如何
我都能理解。: <p class="old-price"> <span class="price"
id
="old-price-8886"> ৳300 </span> &l
浏览 17
提问于2018-12-19
得票数 0
1
回答
Scrapy
+ Python + Xpath : Xpath返回一个空列表
、
、
、
我需要从这个
页面
中
抓取到图片的链接:我编写了这个xpath: response.xpath('//li[@class="geodir-active-slide"]/img/@src').extract
浏览 0
提问于2018-09-21
得票数 0
回答已采纳
1
回答
提交用
Scrapy
动态
呈现的表单?
、
、
、
、
我正在尝试
使用
Scrapy
提交一个
动态
生成的用户登录表单,然后解析对应于成功登录的
页面
上的
HTML
。 我想知道我怎么能用
Scrapy
或者
Scrapy
和Selenium的组合来做到这一点。Selenium使
在
DOM上找到元素成为可能,但我想知道
在
获得完整的
HTML
之后是否可以“将控制权还给
Scrapy
”,以便使它能够执行表单提交并保存必要的cookie、会话数据等,以便抓取
页面
。基本
浏览 2
提问于2015-03-21
得票数 1
回答已采纳
2
回答
为什么我不能在
Scrapy
中
解析响应?
我是新的抓取和
使用
它从拉扎达网站刮数据。我得到了200条HTTP消息,这意味着响应将成功返回。但是我不能解析响应,尽管xpath查询是正确的。有谁可以帮我?谢谢。这是代码:name = 'lazada' all_products = response.xpath('//div[@clas
浏览 19
提问于2020-10-28
得票数 0
1
回答
用Python3 (
Scrapy
,BS4)抓取网站确实会产生不完整的数据。找不到原因
、
、
我现在正试图从其他网站上获取其他的数据,这一次是
使用
SCRAPY
。我尝试了以下URLS: name = "whisky" with open(filename, 'wb') as f: f.write(response.bo
浏览 4
提问于2020-10-22
得票数 0
2
回答
爬行amazon时出现刮擦/选择库错误
、
、
、
我试图
使用
scrapy
和selectorlib来刮掉amazon的优惠
页面
(www.amazon.it/gp/goldbox)amazon.pyimport
scrapy
import selectorlib name = 'amazon'next' in data:
浏览 2
提问于2019-12-08
得票数 1
2
回答
如何
在源代码(Xpath)
中
查找
特定字符串并提取后续文本?
、
、
、
来自以下源代码:...<script bounce ="bla">....</script>我想提取(bla bla),它肯定是
在
(,null,")之后出现的,直到点(")。我不能通过脚本名称
id
和div访问的原因是因为它们对于我通过
scrapy
抓取的每个<
浏览 30
提问于2018-07-20
得票数 1
回答已采纳
1
回答
刮伤能基于
id
向输入提交吗?
、
、
我有一个包含多个输入字段的内联网
页面
,我需要
Scrapy
使用
网页“搜索产品”输入字段进行搜索,它有一个"searchBox“
id
。我已经能够锁定正确的搜索框
使用
Scrapy
和Beautiful,但我不知道
如何
将数据正确地传递回Scrapys表单提交功能。
在
方法1
中
,我尝试将结果简单地作为输入传递给Scrapys FormRequest.from_response函数,但是它不起作用。方法1-
使用
Sc
浏览 0
提问于2019-03-09
得票数 1
1
回答
scrapy
-正在尝试获取“下一个”url
、
我正在
使用
scrapy
,并试图提出一个restrict_xpaths规则,这样爬虫将总是只去下一个图像。我的目标是不断地抓取下一个。有人建议我应该
使用
什么规则吗?谢谢!
浏览 0
提问于2015-11-19
得票数 0
1
回答
对
scrapy
和Xpath感到困惑
、
因此,我从一个粗糙的shell开始,并写道:然后,我
使用
chrome通过右键单击
HTML
代码的位置来复制Xpath,chrome给我的结果是:然后,我
使用
Xp
浏览 0
提问于2017-12-12
得票数 0
1
回答
我可以
在
Scrapy
中
刮一整页,但未能
使用
xpath找到DOM元素
、
、
我是Python的完全初学者,我想用
scrapy
从抓取一些图像with open('baiduImage.
html
', 'wb') as f:这似乎是一个完整的
页面
,所有元素
在
Chrome中都表现良好,但我没有
使用
f.write(response.xpath('/
html
/body').extract()[0我想原因
浏览 2
提问于2014-11-17
得票数 0
回答已采纳
2
回答
将呈现的
页面
从Selenium传递到
Scrapy
、
、
我想刮掉需要登录的Javascript
页面
。我想知道是否可以
使用
Selenium加载并登录到
页面
,然后Selenium将呈现的代码传递给
Scrapy
进行数据提取。import
scrapy
from selenium.webdriver.common.keys import Keysfrom selenium.webdriver.support import expecte
浏览 28
提问于2019-07-24
得票数 1
1
回答
在
newzealand.com上抓取一些数据的xpath是什么?
、
、
我想知道是否有人能告诉我
如何
在上选择xpath?例如:我无法
使用
上面的选择器获取response.xpath
中
的数据,有人能帮我吗?
浏览 1
提问于2015-08-19
得票数 0
1
回答
使用
scrapy
爬网数据时无法获取项目
、
、
我已经检查了chrome
中
的元素: 我想
使用
scrapy
获取红色框(可以不止一个)
中
的数据。我
使用
了以下代码(参见
scrapy
文档
中
的教程): name = "kamusset_spider" start_urls = ['http://kbbi.web.<em
浏览 15
提问于2017-07-07
得票数 0
2
回答
如何
在div
中
获取文本
、
这是我
使用
的语句:但是,它没有返回任何内容。
浏览 1
提问于2019-07-25
得票数 1
1
回答
即使xpath
在
chrome.Why
中
是正确的,
Scrapy
shell也会给出一个空列表的输出?
、
在
Scrapy
shell上执行fetch(url)fetch(r) response.xpath@class='c1_t2i']/div[@class='c2prKC']/div
浏览 1
提问于2020-07-24
得票数 1
1
回答
代码中有防刮保护的
页面
吗?
、
、
我已经尝试过Xpath (//*[@
id
="da_price"],//*[@
id
="da_price"]/text()),.get(''),.extract(),.get('').strip(),Css#da_price,#da_price::text,我也用过漂亮的汤和
scrapy
_splas hand返回无或空的结果。我仍然不想尝试
使用
selenium,因为链接的数量相当大。
浏览 14
提问于2021-01-08
得票数 1
回答已采纳
2
回答
如何
使用
Scrapy
从
动态
加载的网站(Fincaraiz)
中
刮取链接
、
我想了解
如何
使用
Python
中
的
Scrapy
从下面的
页面
提取数据 https://fincaraiz.com.co/inmueble/apartamento-en-arriendo/florida-blanca/bogota/6738284问题 这个
页面
动态
加载内容,所以当我从
Scrapy
浏览 18
提问于2022-02-18
得票数 0
3
回答
Python -
Scrapy
电子商务网站
、
、
,但它返回一个空数组感谢您的帮助,谢谢。
浏览 1
提问于2018-02-23
得票数 0
1
回答
用
Scrapy
创建站点地图
、
、
是否可以
使用
Scrapy
生成一个网站的站点地图,包括每个
页面
的URL及其级别/深度(我需要从主页上跟踪的链接数量)?站点地图的格式不一定是XML,它只是关于信息。此外,我希望保存爬行
页面
的完整
HTML
源代码,以供进一步分析,而不是只从其中抓取某些元素。有经验
使用
Scrapy
的人能告诉我,对于
Scrapy
来说,这是否是一个可能的/合理的场景,并给我一些关于
如何
找到指令的提示?到目前为止,我只能找到更复杂的场景,而没有
浏览 0
提问于2017-11-07
得票数 5
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券