腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
如
何在
scrapy
中
通过
xpath
从
源代码
中
提取
部分
?
、
、
我正在尝试从一个
部分
的网站
源代码
中
提取
文本。我正在尝试
提取
的站点的
源代码
如下: if ('function' === typeof window.ToggleFilters) {} <div
浏览 16
提问于2019-02-10
得票数 0
回答已采纳
1
回答
使用
scrapy
抓取时处理pdf文档
、
、
、
、
我想解析的PDF文件,遇到时,爬行网站使用
scrapy
。我使用下面的代码
从
PDF文档中
提取
HTML页面
源代码
,但它不起作用如何
从
PDF文档
中
获取内容并将其合并到
scrapy
工作流
中
浏览 1
提问于2015-02-13
得票数 0
1
回答
抓取脚本值
、
、
在一个特定的url上使用
scrapy
shell,我试图确定如
何在
页面
源代码
中
从这个脚本中
提取
作者值或贡献者值?我试过了 response.
xpath
('//script').re(r'author":"([0-9.]+)"') 这是网站
源代码
中
的脚本 <script charSet="UTF-8">...
浏览 7
提问于2019-03-06
得票数 1
1
回答
Scrapy
没有输出
、
我正在尝试
从
urls列表中
提取
一些数据,例如,以
提取
所有团队名称。下面是我的爬虫,它正在运行URL,但没有获取任何数据?from
scrapy
.spider import Spiderfrom teams.items import
浏览 4
提问于2014-10-20
得票数 0
1
回答
如何利用
Scrapy
和Selenium
从
亚马逊网站上
提取
产品信息?
、
、
我想用
Scrapy
和Selenium
从
亚马逊网站上
提取
产品的信息。 from
scrapy
.contrib.spiders import CrawlSpider from('//h1[@id="aiv-content-title&q
浏览 3
提问于2015-07-20
得票数 0
1
回答
难以将requests.models.Response转换为
scrapy
.selector.unified.Selector
= requests.get(url) 获取一个requests.models.Response实例,我可以
从
其中使用
scrapy
提取
数据 from
scrapy
import Selectorprint(response.json())
浏览 13
提问于2020-07-02
得票数 0
回答已采纳
2
回答
仅剪贴式正文文本
、
、
、
我尝试使用python
Scrapy
从
正文中抓取文本,但还没有成功。 希望一些学者能够在这里帮助我
从
<body>标记
中
抓取所有的文本。
浏览 1
提问于2011-03-22
得票数 9
回答已采纳
1
回答
刮擦脚本,如何找到特定的关键字并返回或打印url
、
、
、
我已经让脚本
部分
工作,我可以启动它没有任何问题,这是脚本。粘贴链接在这里:,您可以看到我在cmd行
中
得到了什么。我确信正在搜索的关键字在这些链接
中
,因为我也尝试过其他单词,但它没有下载它们。import
scrapy
from
scrapy
.http import Request from FinalSpider.itemsitems.py URL = "http://url.com=%d&q
浏览 2
提问于2015-11-30
得票数 0
回答已采纳
1
回答
Scrapy
-
xpath
提取
程序返回空。
、
、
我的目标是构建一个
从
的表中
提取
数据的刮板。 我可能漏掉了一些很明显的东西。如果你能看看我的代码,让我知
浏览 0
提问于2018-11-03
得票数 0
1
回答
如何获取该页
中
每个广告的数据?
、
、
、
、
我正在抓取这个页面以获取每个Ad:的数据
scrapy
shell "http://www.cars2buy.co.uk/business-car-leasing/Abarth/695C/"
浏览 1
提问于2017-04-29
得票数 1
回答已采纳
1
回答
用于抓取链接内内容的
xpath
问题
、
、
我开始学习
scrapy
,我想知道如
何在
excel文件
中
获得每个州的学校信息。每个状态都是一个指向另一个页面的链接,我不确定如何为此编写
xpath
语法。请给我建议。import
scrapy
name = 'raiseme' allowed_domains = ['raise.mestart_urls = ['http://raise.me
浏览 5
提问于2021-03-20
得票数 0
1
回答
对于一些具有刮伤外壳的元素,
XPath
不返回结果。
、
、
我使用刮除外壳来
提取
以下网页的数据: fetch('https://www.apo-in.de/product/acc-akut-600-brausetabletten.24170.html') >>> response.
xpath
"accordionContent5e95408f73
浏览 4
提问于2020-04-14
得票数 0
回答已采纳
1
回答
从
在Chrome dev工具
中
工作的表中
提取
<a>标记,但不是在
scrapy
shell上
、
、
、
我正在尝试
提取
论坛中所有帖子的标题()但是,相同的
xpath
在
scrapy
shell
中
不起作用。附件是chrome devtools的工作演示
浏览 2
提问于2018-02-21
得票数 0
2
回答
数据生成空括号表的
Scrapy
xpath
构造
、
、
我正在尝试为数据项构建
xpath
结构,我希望从一个站点的数百页中
提取
所有格式化相同的数据项。一个示例站点是response.
xpath
('.]/span/text()').extract() 我不知道如何
浏览 0
提问于2015-06-10
得票数 0
回答已采纳
1
回答
通过
Scrapy
(Python)将刮过的数据导出到csv后,我将在文件
中
获得-欧元之类的字符
、
、
我用
Scrapy
编写了一个蜘蛛来
从
quotes.toscrape.com中
提取
数据,但是当我将
提取
出来的数据导出到csv时,“(引号符号)正在将自己转换成字符,比如-欧元。# -*- coding: utf-8 -*- name = 'Test' allowed_domains//*[@class="text"]
浏览 0
提问于2018-06-19
得票数 2
回答已采纳
1
回答
编写
xpath
选择器的最佳实践
、
、
、
我开始学习
xpath
和python
scrapy
。到目前为止,我已经学习了这些two.But的基础知识,现在我需要知道如何定义有效的
xpath
选择器,以及在
scrapy
和
xpath
.Is
中
的一些最佳实践。有什么好的web资源可以帮助我吗?
浏览 2
提问于2014-11-17
得票数 0
1
回答
无法使用
scrapy
提取
完整的url @href
、
、
、
我正在尝试
从
amazon.in中
提取
产品的url。
源代码
中
a-tag
中
的href-attribute如下所示:/Parachute-Coconut-Oil-Bottle-600ml/dp/B071FB2ZVT?dchild=1 我使用了以下
xpath
:
浏览 0
提问于2020-05-05
得票数 1
1
回答
表-
xpath
帮助
中
的刮擦标记和嵌套标记
、
、
、
、
我刚开始刮擦,在从表格
中
的嵌套标记中
提取
文本时遇到了一些困难。我发现的示例教程大
部分
仍然引用旧的被弃用的HtmlXPathSelector,但是我使用的是在更新的scrapyv0.22
中
找到的新的“选择器”导入(我相信HtmlXPathSelector在2013年的某个时候被废弃了::td//text()').extract() exceptions.AttributeError: 'unicode' object has no attribute '
浏览 4
提问于2014-02-03
得票数 0
回答已采纳
1
回答
搜索在
scrapy
中
具有指定属性的元素外部返回结果的
Xpath
、
、
、
我正在使用
scrapy
shell抓取这个站点的子类别
部分
中
的所有链接:。可能有一种更高效的
Xpath
,但我想到的是:据我
从
页面
源代码
可以看出,只有一个带有[@id当我在Chrome
中
搜索这个
Xpath
时,这是有效的。但是当我跑的时候 response.
浏览 1
提问于2016-08-01
得票数 0
1
回答
条件URL抓取
、
、
我试图在一个我不知道网址结构的网站上使用
Scrapy
。
scrapy
crawl dmoz>test.txtfro
浏览 5
提问于2016-07-27
得票数 1
点击加载更多
相关
资讯
Scrapy框架的使用之Selector的用法
Python数据科学实战系列之Web信息爬取
爬虫CrawlSpider原理
Scrapy向导
Scrapy框架新手入门教程
热门
标签
更多标签
云服务器
ICP备案
云直播
实时音视频
即时通信 IM
活动推荐
运营活动
广告
关闭
领券