腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
使用
itemloader
填充
空
项
?
、
、
、
我让我的代码比实际代码更简单 company = scrapy.Field() class GmarketLoader(
ItemLoader
如果页面无效,我认为项目’‘owner’
填充
为None。_values[key] KeyE
浏览 17
提问于2019-11-05
得票数 1
1
回答
选择器属性在
ItemLoader
对象中的用途和用途是什么?
、
、
、
ItemLoader
objects classs crapy.loader.
ItemLoader
(item=None, selector=None, response=None, parent=None, **context)用户友好的抽象,通过应用字段处理器来抓取数据来
填充
数据
项
。Parameters item (scrapy.item.Item) --
使用
对add_xpath()、add_css()或add_value()的后续调用
填充
项
实例。我已经阅读了scra
浏览 4
提问于2022-09-12
得票数 1
回答已采纳
2
回答
在scrapy项目加载器上
使用
正则表达式
、
、
、
我正在尝试弄清楚
如何
在scrapy项目加载器中
使用
regex。我曾尝试将lambda函数与split()一起
使用
,但得到了以下错误。无法定义拆分。您可以看到该函数在项目加载器类中被注释掉了。我要做的是删除日期之前的所有文本,包括日期
项
的"/“。日期
项
是我刚刚解析的url。
如何
将正则表达式与scrapy项目加载器一起
使用
?response.url) items
浏览 4
提问于2018-02-20
得票数 0
回答已采纳
2
回答
将刮伤爬虫结果插入postgresql时出现的卷曲括号问题
、
、
、
使用
刮伤外壳时:并试图提取网址的标题:import scrapyfrom scrapy.contrib.linkextractors
浏览 1
提问于2014-10-27
得票数 0
回答已采纳
1
回答
scrapy:用
itemLoader
填充
嵌套
项
、
、
我有一个试图用
itemLoader
填充
的对象: "domains": "string", "titlecategories', '//ul[@class=\'breadcrumbs\']//li[not(contains(@class, \'home\'))]'
浏览 3
提问于2016-12-26
得票数 2
1
回答
刮刮:
使用
itemLoaderi.c.w.的最佳方法是什么。一条邮政管道?
、
、
、
我试图
使用
itemLoader
在Scrapy中给
空
项
一个默认值,如items.py中的如下所示: default=[],) 因此,如果没有设置prod_specs,它应该给它一个
空
对象。我认为,我
使用
的是item['prod_specs'],而不是items.py中的
ite
浏览 2
提问于2014-07-11
得票数 1
回答已采纳
3
回答
刮除:从列表中删除行提要/n
、
站点
项
的xpath选择器以列表的形式生成内容;不过,我希望它将其转换为没有行提要等的单个字符串。我知道,规范化的空格和条带()将是可行的,但是它们只删除前导/尾随行提要,从而将['']作为输出。
浏览 1
提问于2020-07-09
得票数 0
回答已采纳
2
回答
如何
动态生成字段
、
当我查阅官方scrapy文档时,我发现字段可以动态添加,但我不知道
如何
做到这一点 我尝试了
ItemLoader
的一个演示,它像测试代码一样成功: 我为
ItemLoader
传递了一个field_name_listfield_list = [] field_list.append(key) loader =
ItemLoader
File "F:\Newspider\news_project\new
浏览 10
提问于2019-04-02
得票数 2
回答已采纳
1
回答
使用
scrapy抓取同一名称的多个唯一
项
。
、
、
、
of review ids item = response.meta['item']下面是我的items.json ("review_review“正在被删除,解析方法中的
项
也被删除
浏览 3
提问于2014-07-15
得票数 0
1
回答
Scrapy:项目加载器和KeyError,即使定义了键
、
、
//div[@class="details"]/h2/a[@href]/text()')Item.py -
Itemloader
title_in = MapCompose(unidecode)我有点不知所措,因为我认为我遵循了Scrapy手册,用"title_in
浏览 2
提问于2017-01-21
得票数 1
回答已采纳
1
回答
使用
Scrapy1.5刮取多级菜单
、
、
import CrawlSpider, Rulefrom scrapy.loader import
ItemLoader
'parse_collections', follow=True), l =
ItemLoader
response.url) def p
浏览 1
提问于2018-11-21
得票数 1
回答已采纳
2
回答
使用
自定义方法扩展Scrapy
ItemLoader
、
但是,您声明的任何ItemLoaders都将应用于所有已处理的
项
。您可以
使用
稍微修改它们的行为,但这通常不够细粒度。假设我有一个Scrapy项目,其中的爬行器和
项
都继承了相同的基本爬行器和
项
加载器,但爬行器都包含特定于站点的逻辑和一些公共函数。而不是: def parse_item(self, response): product =
ItemLoader
尽管这似乎是一种显而易见的扩展ItemLo
浏览 0
提问于2019-02-02
得票数 1
1
回答
使用
scrapy将带有用户附加元素的数据放入csv
、
、
、
、
我有一个
使用
scrapy的运行脚本,它从表中获取数据。但是由于原始数据是按行参数顺序保存的,所以它是按格式保存的:firstitem...如果没有类似的“名称”,我
如何
将这个数据保存为行格式 21:
浏览 3
提问于2019-02-22
得票数 1
回答已采纳
3
回答
刮取导入项目加载器ModuleNotFoundError:没有名为“itemloaders”的模块
、
我有一个
使用
2.0版本的scrapy项目,但是当我升级到2.4版本时,我得到了上面的错误。
浏览 1
提问于2020-10-21
得票数 1
1
回答
scrapy -
如何
使用
pandas dataframe中的数据
填充
项目?
、
、
假设CrawlSpider如下:from scrapy.loader import
ItemLoader
for selector in response.css('div.content'):以及相应的items.py:from
浏览 0
提问于2016-06-17
得票数 3
2
回答
更好的抓取技巧:
如何
使用
抓取项目加载器嵌套来输出字典列表而不是列表字典
、
我正在尝试
使用
scrapy项目加载器,我过去只
使用
项目,我希望我的代码较少例如:如果我想从页面解析汽车信息列表,我需要car_name,car_color...but用于某些汽车,颜色是None,我过去写成这样CarItem() item['car_color'] = car_color但是最近,我发现了
Itemloader
,它可以简化代码,从文档中,我发现它是这样工作的: loader = <em
浏览 11
提问于2017-01-20
得票数 2
2
回答
抓取
Itemloader
:
如何
使用
Item()/dict加载
、
如果我有一个已经
填充
的Item(),我将
如何
用它加载一个项目加载器?例如 desc_out = MapCompose(\n\ta\n'}))#output still: {'desc': "\r\t\n some text \t\n"} 我想
浏览 4
提问于2014-12-14
得票数 1
回答已采纳
1
回答
如何
更改
ItemLoader
的选择器
、
我试图
使用
来自多个页面的
ItemLoader
解析数据
填充
项
。但是,正如我现在所看到的,我不能更改我在初始化
ItemLoader
时
使用
的选择器。它要么是构造函数中给出的选择器,要么是
使用
default_selector_class在构造函数中给出的响应创建的选择器。此属性意味着只读。response) for
浏览 0
提问于2014-04-07
得票数 6
回答已采纳
1
回答
在哪里定义项目自定义项目加载器在刮刮?
、
、
我开始在scrapy中
使用
项目加载器,基本功能运行良好,如下所示:to_int = Compose(TakeFirst(), int) desc
浏览 0
提问于2018-04-22
得票数 1
回答已采纳
1
回答
如何
将多个抓取的项目合并为一个项目?(Scrapy)
、
、
、
假设我想
使用
选择器从中抓取文本从这里,我得到了项目列表[u'My image 1', u'My image 3', u'My image 5']
如何
合并
浏览 1
提问于2014-12-03
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何正确使用底部填充胶水
Proe/Creo如何使用曲面填充?
如何使用填充功能快速输入序列数据
Excel如何使用快速填充实现数据的重组合并?快速填充识别错误?
Excel中如何使用条件格式来隔行填充颜色
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券