腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
粗糙
的
Python
response.css
循环
、
、
我正在尝试
循环
这个网站上
的
每一个报价: args={'wait': 5.0} for item in
response.css
Marina Holiday Village', 'Semeli
浏览 14
提问于2018-08-23
得票数 1
回答已采纳
1
回答
如何将"query url“作为项目添加到输出中
、
、
我有一个urls列表,我将它们作为start_urls导入到一个
粗糙
的
项目中。我想在输出中添加生成这些结果
的
查询(url)。例如,如果我有"First title results“、"Address”等->生成此输出
的
URL。这是我
的
代码 import scrapy class GmapsclosedlocationsSpider(scrapy.Spider):' :
response.css
(&
浏览 28
提问于2021-11-01
得票数 0
回答已采纳
3
回答
是否从集合元素中删除unicode字符?
、
、
、
python
新手。我正在写一个刮板,它产生了一组值,这些值都有unicode字符。
浏览 0
提问于2017-08-10
得票数 0
1
回答
包含几个绝对urls“urljoin”
的
列表
、
我想下载所有的文件从第一篇文章,几个论坛主题
的
一个特定
的
。我已经设置了自己
的
文件管道,用于获取项目file_url、file_name和source(主题名称),以便将它们保存到文件夹.但是,文件链接是相对
的
,我需要使用绝对路径。我尝试了response.urljoin,它给了我一个绝对url
的
string,但是只给出了帖子
的
最后一个文件。start_urls = [base_url + subforum_url]
浏览 11
提问于2019-10-31
得票数 0
回答已采纳
2
回答
如何在scrapy中从后面的函数中获取数据
、
、
、
我在构建我想要
的
粗糙
数据时遇到了麻烦。我
的
爬行器从一个页面获取一些数据,然后沿着该页面上
的
链接列表获取下一个页面的链接。def parse_page(self, response): links =
response.css
(LINK_SELECTOR).extract() 'name':
response.css
(NAME_SELECTOR).extract_first(),
浏览 63
提问于2020-11-03
得票数 1
回答已采纳
1
回答
抓取项只保存
循环
中
的
最后一个元素。
、
我从爬行网站得到
的
结果,我想把它保存到数据库。我使用刮除物品和管道。def parse(self, response): total_results =
response.css
('.cl-filters-summary-counterreference_url'] = item[1] car['data
浏览 5
提问于2018-06-07
得票数 0
回答已采纳
1
回答
如何在html脚本中从href获取嵌入式http - scrapy
、
、
我想从这个html脚本中获得嵌入
的
http链接。我是的一个
粗糙
的
外壳,那么如果我使用
response.css
(‘p.mb-0a::attr(Href)’).get(),我只会得到'/architectbath/menus/‘,而不是如图所示
的
完整http不幸
的
是,我不能仅仅把这个添加到我已经拥有的url中。
浏览 2
提问于2022-10-28
得票数 0
2
回答
Scrapy Page不重定向
、
、
我正在尝试抓取MercadoLibre
的
产品列表。我使用
的
是Scrapy 1.5.0。当Scrapy尝试转到下一页时,它会
循环
第一页和第二页。代码# Scrapy 1.5.0 from scrapy.http import Request def parse(self, respon
浏览 10
提问于2018-10-11
得票数 0
1
回答
无法使用Scrapy获取响应
、
、
我是scrapy
的
新手,我正在尝试从一个网站获取一个列出名字
的
简单csv文件。在一个
粗糙
的
shell中,它似乎可以工作,但使用爬行器没有任何响应。我使用
的
是以下代码:name = "jupiter"
浏览 11
提问于2017-08-06
得票数 0
回答已采纳
1
回答
刮除-每个星形单独
的
输出文件
、
、
、
、
我有一只皮肤
粗糙
的
蜘蛛运行良好:import scrapy urls =
response.css
url=url,callback=self.parse_detai
浏览 0
提问于2017-11-18
得票数 3
1
回答
为什么选择器
循环
中
的
xpath仍然返回本教程中
的
列表
、
我发现,尽管它已经在选择器列表中
循环
,但我从sel.xpath('a/text()').extract()获得
的
平铺仍然是一个列表,其中包含一个字符串。比如[u'
Python
3 Object Oriented Programming']而不是u'
Python
3 Object Oriented Programming'。在后面的示例中,将列表分配给作为item['title'] = sel.xpath('a/te
浏览 1
提问于2016-02-26
得票数 5
回答已采纳
1
回答
用Scrapy提取问题
、
、
p=1&q=React+Django&type=Users
response.css
(".mr-1::text").get()
response.css
(".mb-1::text").get()
response.css
("#user_search_results .mr-3:nth-child(1)::text").get()# Email
response.css
(&
浏览 3
提问于2021-07-10
得票数 1
回答已采纳
1
回答
Scrapy输出空
的
JSON / CSV文件
、
我对scrapy和
python
非常陌生,真的需要一些帮助。我已经让这段代码在命令行中工作了。我可以看到它在浏览不同
的
页面时提取了所有正确
的
信息。我
的
问题是,当我试图将脚本
的
输出保存到一个文件中时,它是空
的
。我已经在这里看了很多其他问题,但找不到任何有帮助
的
东西。('div'): title: (
response.css
('title::text')
浏览 49
提问于2020-04-30
得票数 0
回答已采纳
2
回答
如何在抓取数据时遍历同级标记
、
、
我试图使用
python
框架从中抓取编辑器数据。
response.css
("#editors-section>div.row.align-items-center")但是如何收集各自
的
roles.How来
循环
遍历所有的标记。
浏览 14
提问于2022-09-02
得票数 1
回答已采纳
3
回答
数据抓取:如何使用Scrapy从样式标记中选择宽度?
、
、
、
我试图通过使用width从div中选择CSS Selector,但这对我来说是不可能
的
。我尽力寻找解决方案,但每次我都喜欢用xpath而不是css选择器解决方案。class="stars" style="width: 60.606%"> Rating</div>在通过width获得response之后,我尝试从上面的html中选择html:
response.css
('.stars-container .stars ::attr(width)&
浏览 4
提问于2017-10-23
得票数 2
1
回答
刮擦属性错误:类型对象没有属性get
、
、
我一直在处理一个在shell中运行它时使用
的
刮取脚本,但是当我设置从
python
运行它时,我会得到这个错误。(错误第一,代码第二)。错误: it
浏览 3
提问于2022-01-17
得票数 0
1
回答
如何获取id对应
的
值
、
、
、
我想要获取"id“和它在锚标签中
的
相应值。import HtmlResponse item = {} item['value'] = x.css('a.tim::text').extract
浏览 0
提问于2017-09-19
得票数 1
1
回答
通过刮除管道组织项目
、
(这个部分是可以
的
),并通过条目和管道来解析结果。下面是解析函数
的
代码: item = ScrapybotItem() price_list =
response.css
("li.lvprice.prc span::text").extract() item[
浏览 1
提问于2018-11-06
得票数 0
回答已采纳
1
回答
Python
和Scrapy - Scraper不返回结果。
、
、
您好,并感谢您在此问题上
的
任何帮助,我有。我从来没有张贴过编码帮助,我是非常新
的
编程。自学成才
的
老家伙,他试图学习一些新
的
东西,也许建立一些东西来拯救世界(或者只是建立一些东西。):) 我已经抓取了启动,当我运行我
的
终端命令“抓取爬行合作社”,我总是得到调试:爬行(200),没有看到任何“找到
的
细节:”入口。我能够运行刮擦外壳"“,并手动获得结果
的
外壳。当我尝试向.jl或.js文件屈服时,它们也是空
的
。(我用刮伤教程
的
引号把
浏览 1
提问于2020-04-29
得票数 1
回答已采纳
1
回答
遍历字典: TypeError:列表索引必须是整数或片,而不是str
、
、
我是
Python
的
新手,试图用Scrapy构建一个web刮刀,结果我得到了很多非打印和空白。我正在尝试使用for
循环
迭代字典,其中
的
值是列表,然后运行.strip()方法来消除所有非打印字符。('.jobtitle::text').extract() company =
response.css
('span.company::text').extract()location =
response.css
('.locatio
浏览 1
提问于2020-03-31
得票数 0
回答已采纳
点击加载更多
相关
资讯
Python的for循环
Python的while循环
Python中的For循环
Python中的while循环
Python 循环语句的使用
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
智聆口语评测
活动推荐
运营活动
广告
关闭
领券