腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
Scrapy
-
对
项目
列表
使用
“
normalize
space
”
、
正在尝试从html
列表
中删除转义符号和空格。我正在
使用
normalize
space
(),但无法将其应用于整个
列表
。我正在
使用
scrapy
shell测试我的代码
scrapy
shell https://universalmotors.ru/boardmotors/suzuki/suzuki-df-4-s/ <tr<span itemprop="value"&
浏览 32
提问于2019-04-23
得票数 1
回答已采纳
1
回答
为什么选择器循环中的xpath仍然返回本教程中的
列表
、
我发现,尽管它已经在选择器
列表
中循环,但我从sel.xpath('a/text()').extract()获得的平铺仍然是一个
列表
,其中包含一个字符串。在后面的示例中,将
列表
分配给作为item['title'] = sel.xpath('a/text()').extract()的项,我认为这在逻辑上是不正确的。import
scrapy
name =
浏览 1
提问于2016-02-26
得票数 5
回答已采纳
2
回答
Scrapy
Spider错误处理正确的链接
、
这是
项目
的细目。/preceding-sibling::td[
normalize
-
space
()='Cost of Goods Sold (COGS) incl./preceding-sibling::td[
normalize
-
space
()='Cost of Goods Sold (COGS) incl.我曾尝试在settings.py中指定标头,但这个爬行器实际上将
使用
超过5000个start_urls,并且我不确定如何将此设置用于多个urls
浏览 46
提问于2019-03-17
得票数 0
回答已采纳
1
回答
无法为html页面中的
列表
获取xpath选择器
、
由于无法获得正确的
项目
列表
xpath,在选择整个
列表
时始终会出现空
列表
问题。div[@id="content_features"]'): { 'name': prop.xpath('
normalize
-
space
/*[@class="ty-product-feature__label"]
浏览 1
提问于2019-04-29
得票数 0
回答已采纳
1
回答
具有动态路由的抓取站点
、
、
如何
使用
动态路由从站点中刮除所有工具?当我试图我收到以下结果 2017-01-07 22:43:06
浏览 2
提问于2017-01-07
得票数 1
回答已采纳
1
回答
在
Scrapy
中,我如何从
列表
中删除空值,并将
列表
组合成一个字符串,比如段落?
、
、
、
、
我刚开始刮擦,找不到合适的解决方案,就像我试图得到一个完美的段落,但无法做到这一点,我得到了一个包含一些空值的
列表
,比如'‘如何
使用
项目
加载器删除它们?def
normalize
_
space
(value): return lst input_processor = MapCompose(
normalize
_
浏览 3
提问于2022-10-02
得票数 -1
1
回答
爬行0页,刮取0项
、
、
、
我刚开始学习Python和
Scrapy
。爬行0页(0页/分钟)刮0项(0项/分钟)
项目
: # define the fields fordiv[1]/div[2]/div[2]/div
浏览 0
提问于2018-09-09
得票数 0
回答已采纳
3
回答
与
Scrapy
一起
使用
规范化空间
、
、
、
、
关于可能重复的,我按照可能重复的通知添加了/
normalize
-
space
(.),给出了如下内容:这会产生ValueError: Invalid XPath:错误。
浏览 7
提问于2015-11-24
得票数 4
回答已采纳
1
回答
物品装载机在刮擦中不能正常工作
、
我试着研究
项目
加载器,下面的代码不能正常工作:它只给我"start_url“值,而不是"SUBJECT”和"CREATOR2“值(它们根本不出现,不只是一个空槽)。我搞不懂它为什么这么做。我需要
使用
项目
加载器,特别是用于"CREATOR2“值,这个值有时在xpath上,有时在另一个上。response.request.url l.add_xpath('CREATOR2', '//font[@size="+1"]/c
浏览 0
提问于2016-05-16
得票数 3
回答已采纳
2
回答
规范化空间只适用于xpath而不是css选择器。
、
、
、
、
我正在
使用
scrapy
和python提取数据。xpath('
normalize
-
space
(.但是,现在我想在css选择器中
使用
normalize
-
space
。我试过这个: car['Location'] = site.css('
normalize
-
spac
浏览 1
提问于2014-01-14
得票数 0
回答已采纳
1
回答
刮不印终端上的所有物品
、
、
、
我在终端中
使用
这个命令,
使用
SCRAPY
,但它没有打印所有的
项目
。
scrapy
shell https://access.redhat.com/errata/RHSA-2017:0621 response.xpath('
normalize
-
space
((//div[
浏览 5
提问于2020-09-17
得票数 0
1
回答
我想让
Scrapy
把每件东西都翻一遍
、
、
、
、
我
对
Scrapy
和Python都很陌生,所以任何建议我都很感激。for site in sites: item['
浏览 2
提问于2015-08-19
得票数 1
回答已采纳
1
回答
用刮痕刮网
、
//tr[@class='vendor ']") item["quantity"] = vendor.xpath("
normalize
-
space
(.
浏览 2
提问于2014-06-10
得票数 1
回答已采纳
1
回答
因为它在xpath中被引用到另一个视图标记
、
我
使用
的是
scrapy
框架,我不能从我分析的网页中加载其他数据,它有一个标签可以看到更多。你能告诉我你能做些什么吗,谢谢。(//h1)').extract()
space
(//small)').extract() ml_item['contenido'] = response.x
浏览 0
提问于2017-11-13
得票数 0
3
回答
Xpath:为什么规范化-空间不能删除空空间和\n?
、
关于下列代码:Low priceyou should not miss我
使用
了这个//a[@class="title"]//text()[
normalize
-
space
()]').extract()u'
浏览 0
提问于2015-10-13
得票数 6
回答已采纳
1
回答
Scrapy
和rules
、
、
我是从
Scrapy
开始的,我成功地制作了几个蜘蛛攻击同一个网站。 # info de producto
浏览 15
提问于2020-06-05
得票数 0
回答已采纳
1
回答
在
Scrapy
中传递xPath翻译函数
对
特殊字符无效
、
、
我正在构建一个
Scrapy
爬行器,它接受xpath查询作为输入参数。import
scrapy
class GenericSpider(
scrapy
.Spider):respon
浏览 5
提问于2016-08-03
得票数 0
1
回答
用刮擦刮多个页面
、
、
、
我正在尝试
使用
刮擦刮刮一个有几页信息的网站。我的代码是:from
scrapy
.selector import Selector item["price"] = vendor.xpath("
normalize
-
space
(./&
浏览 3
提问于2014-05-27
得票数 5
回答已采纳
1
回答
如何
使用
scrapy
刮取多个引号页数据
、
、
我已经开发了一个代码来抓取单个页面的数据,但是我不知道如何
使用
我的刮取代码来刮取多个数据 name
浏览 2
提问于2022-06-04
得票数 -1
2
回答
Scrapy
1.1/Python3 3从字符串中删除字符串
、
、
www.example.com/t/search-title-Proprietor.html" style="color:#259cd5">Proprietor</a> John Doe</strong></p>我尝试了一堆正则表达式,并
使用
变量,但我总是遇到另一个问题。'] = response.xpath('//*[@id="
浏览 3
提问于2016-08-18
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
DefiLlama创始人公布因与域名注册商Square Space相关而面临攻击风险的项目列表
scrapy爬取豆瓣热门电影
Scrapy向导
高级爬虫:Scrapy爬虫框架初探
Python爬虫实战(3)-爬取豆瓣音乐Top250数据(超详细
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券