腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Scrapy
找不到
svg
元素
的
xPath
、
、
我正试着用我
的
第一个蜘蛛抓取一个带有图表
的
网页。当我尝试使用此图表
的
chrome locate
XPath
时,它给出了如下内容:在搜索之后我也尝试了一下, //*[@id="highcharts-jji61bd-2"]/[name()='
svg</em
浏览 4
提问于2018-01-18
得票数 0
回答已采纳
2
回答
这个Sprite
SVG
可以抓取吗?
、
、
、
、
我可以用标准
的
Scrapy
刮掉这个吗?还是我需要使用Selenium?html为: <td class="example"><sprite-
svg
name="EXAMPLE2"><
svg
><use xlink:href="/spritemap/1_0_30#sprite-EXAMPLE2"></use></
svg
></
浏览 16
提问于2020-07-07
得票数 2
回答已采纳
2
回答
如何让Python
Scrapy
跳过css规则和html属性
、
、
我有一个蜘蛛爬行
的
联系方式从给定
的
网址(S)。 运行良好,但它收集
的
一些数据来自页面上
的
css规则,例如,一些<
svg
></
svg
>属性可能显示为有效数字。或者像404_static_desk_1920-w375@1x.jpg这样
的
<scripts></script>中
的
一些图像映射可能会显示为有效
的
电子邮件地址。如何让
scrapy
忽略某些标签并完全
浏览 61
提问于2021-11-04
得票数 0
1
回答
在包含"sometext“
的
网页中获取链接
的
xpath
、
、
我正在使用
scrapy
(网络爬行框架)。是否可以在网页中获取某个
元素
(包含"sometext")
的
xpath
,以便提取具有类似
xpath
的
元素
?我不希望我
的
xpath
被硬编码,因为我将爬行多个网站。 我刚开始刮擦,我已经找了好几天了,什么也
找不到
浏览 2
提问于2016-01-16
得票数 0
回答已采纳
1
回答
Scrapy
-
找不到
xpath
元素
、
、
、
我刚从
Scrapy
开始。我想从中刮掉中
的
所有职位,并将其保存在CSV文件中。但当我运行命令时: name = "jobscraper" 'rd=0', for off
浏览 2
提问于2021-04-11
得票数 0
回答已采纳
1
回答
无法通过
XPATH
定位HighChart
元素
、
问题:我有以下
的
HTML (ScreenShot图像链接),并且我想找到红色
元素
,我使用了
XPath
,
XPath
= //div[@id="SpendByVendorPieChart"]/div[@id="highcharts-10"]/
svg
/g[@class="highcharts-series highcharts-series-0 highcharts-tracker"]/pa
浏览 5
提问于2016-11-14
得票数 0
回答已采纳
2
回答
findElements(By.
xpath
(".//g") )在<
svg
>标签中不工作
、
、
、
、
编辑:一位评论者正确地指出,事实上,我正在使用
的
HTML代码都在标记中,这似乎对这个特定
的
情况产生了决定性
的
影响。log.info(eventGroup.getAttribute("outerHTML&quo
浏览 7
提问于2017-04-25
得票数 3
回答已采纳
1
回答
查找链接
的
XPath
表达式提供"TypeError: Request必须是str或unicode,got“
、
、
这是我
的
蜘蛛from lawn.items import LawnItemimport re # Defining rows to be scraped
浏览 1
提问于2019-11-27
得票数 0
回答已采纳
0
回答
Scrapy
+ Splash:抓取内部html中
的
元素
、
、
我正在使用
Scrapy
+ Splash抓取网页,并试图从google广告横幅和其他广告中提取数据,但我很难让
scrapy
跟随
xpath
进入它们。
scrapy
经常遇到
的
脚本问题--它读取脚本
的
内容,而不是生成
的
html --但我似乎
找不到
一种方法来指明访问所需
元素
节点所需
的
XPath
(ad
的
href链接)。如果我在google中检查
元素
并复制它
的</em
浏览 11
提问于2017-06-20
得票数 1
回答已采纳
1
回答
如何使用
scrapy
获取xlink:href/
svg
id
的
名称?
、
、
我对
scrapy
完全是个新手,昨天才开始使用它。有一个页面上有我想要获得
的
产品
的
评级。不幸
的
是,收视率不是文本,而是明星。假设一个产品有两颗星,它看起来是这样
的
: <div class="index-classIcon index-red"> <path d=&q
浏览 2
提问于2018-12-01
得票数 0
2
回答
Scrapy
:如何在
scrapy
/wget已经下载
的
文件上使用
XPath
选择器?
、
我
的
项目涉及解析已经通过
Scrapy
或wget下载
的
文件。我知道我可以使用
XPath
选择器,但是到目前为止,我看到
的
示例涉及到在
Scrapy
的
解析方法中调用
XPath
选择器,因此只对
Scrapy
下载
的
文件起作用。有没有一种方法可以直接对下载
的
文件使用
XPath
?我是Python和
Scrapy
的
新手,所以我
找不到
在独立
的<
浏览 2
提问于2013-01-13
得票数 0
1
回答
如何在
Scrapy
中用tbody抓取这个HTML结构?
、
、
" class="table table-striped table-bordered text-center table-condensed removeSidePadding" style=""
xpath
,除了
Scrapy
生成
的
样板代码之外,我没有太多要显示
的
内容。我一直在shell中专门工作,这样我就可以一个接一个地挑选这些
元素
,但我遇到
的
问题是空列表。我之前做过研究,发现
scrapy
不会拾取这些tbody标签,
浏览 51
提问于2020-07-27
得票数 0
2
回答
抓取下一页
的
抓取循环
、
、
、
你好,我正在尝试进入单词抓取器和爬虫,但是我不明白为什么我
的
代码不能转到下一页和循环。import
scrapy
from
scrapy
import* for buyers in allbuy
浏览 27
提问于2021-03-31
得票数 0
回答已采纳
2
回答
找不到
SVG
元素
的
Xpath
、
、
、
找不到
SVG
元素
的
xpath
。下面是
SVG
的
HTML部分<div _ngcontent-qqf-c17="" class="visual visual-card allow-deferred-rendering" focus-nav-mode="Gr
浏览 0
提问于2019-11-04
得票数 0
1
回答
逐列输出数据,我想逐行刮擦。这怎么可能呢?
、
、
、
下面是蜘蛛
的
代码和图片如下所示: rows=response.
xpath
('//*[@id="table-timetable//tr/th/strong/text()').extract() item['Time'] = row.
xpath
('.//td/span[1]/text
浏览 5
提问于2016-11-03
得票数 0
回答已采纳
2
回答
无法找到Chrome DevTools给出
的
DevTools
、
、
、
、
当我在回答有关Selenium
的
问题时,正在试验一些
SVG
路径时,我发现
XPath
在Chrome上有一种奇怪
的
行为(我没有在其他浏览器上尝试)。而这个做 //*[@id="chartdiv"]/div/
浏览 7
提问于2014-11-13
得票数 4
回答已采纳
1
回答
如何解决下面的python-
scrapy
错误?
、
它在执行过程中没有显示错误,但我得到了一个空白文件,用于蜘蛛
的
output.My代码如下所示: from
scrapy
.selectorwww.timeanddate.com/worldclock/"] titles = response.selector.
xpath
("//tr/td[@a
浏览 2
提问于2017-05-07
得票数 1
回答已采纳
2
回答
使用特定
的
<a>获取<span>
、
、
我正在使用
Scrapy
从一个网站获取一些数据。我有以下链接:<a href="?isin=IT0000072618&lang=it&page=1"></a>我只想提取'a‘
元素
的
href属性,该
元素</e
浏览 6
提问于2016-11-22
得票数 0
回答已采纳
2
回答
在
scrapy
和
xpath
中使用布尔()和count()之类
的
函数
、
、
、
因此,我试图使用
xpath
函数boolean()并使用
scrapy
提取真正
的
false响应,但是所有的
scrapy
返回都是u'0'。不管它是返回布尔值真还是布尔值:false
scrapy
总是返回基本上这是我
的
xpath</e
浏览 13
提问于2017-07-19
得票数 1
3
回答
提供所有匹配
元素
的
Scrapy
xpath
我有一个HTML文件,我想从其中提取特定DIV下
的
锚点href值。) self.log(f'total records = {len(hrefElements)}') 我
的
问题是,为什么我需要使用中间选择变量来存储提取<
浏览 16
提问于2022-03-29
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
python爬虫技术:如何定位网页上的内容?xpath定位元素
Scrapy框架的使用之Selector的用法
Scrapy爬虫(1)爬取菜鸟Git教程目录
爬虫小记(一)
Scrapy向导
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券