Scrapy找不到svg元素的xPath

、、

我正试着用我的第一个蜘蛛抓取一个带有图表的网页。当我尝试使用此图表的chrome locate XPath时，它给出了如下内容：在搜索之后我也尝试了一下， //*[@id="highcharts-jji61bd-2"]/[name()='svg</em

浏览 4提问于2018-01-18得票数 0

回答已采纳

2回答

这个Sprite SVG可以抓取吗？

、、、、

我可以用标准的Scrapy刮掉这个吗?还是我需要使用Selenium？html为： <td class="example"><sprite-svg name="EXAMPLE2"><svg><use xlink:href="/spritemap/1_0_30#sprite-EXAMPLE2"></use></svg></

浏览 16提问于2020-07-07得票数 2

回答已采纳

2回答

如何让Python Scrapy跳过css规则和html属性

、、

我有一个蜘蛛爬行的联系方式从给定的网址(S)。运行良好，但它收集的一些数据来自页面上的css规则，例如，一些<svg></svg>属性可能显示为有效数字。或者像404_static_desk_1920-w375@1x.jpg这样的<scripts></script>中的一些图像映射可能会显示为有效的电子邮件地址。如何让scrapy忽略某些标签并完全

浏览 61提问于2021-11-04得票数 0

1回答

在包含"sometext“的网页中获取链接的xpath

、、

我正在使用scrapy (网络爬行框架)。是否可以在网页中获取某个元素(包含"sometext")的xpath，以便提取具有类似xpath的元素？我不希望我的xpath被硬编码，因为我将爬行多个网站。我刚开始刮擦，我已经找了好几天了，什么也找不到

浏览 2提问于2016-01-16得票数 0

回答已采纳

1回答

Scrapy -找不到xpath元素

、、、

我刚从Scrapy开始。我想从中刮掉中的所有职位，并将其保存在CSV文件中。但当我运行命令时： name = "jobscraper" 'rd=0', for off

浏览 2提问于2021-04-11得票数 0

回答已采纳

1回答

问题:我有以下的HTML (ScreenShot图像链接)，并且我想找到红色元素，我使用了XPath， XPath = //div[@id="SpendByVendorPieChart"]/div[@id="highcharts-10"]/svg/g[@class="highcharts-series highcharts-series-0 highcharts-tracker"]/pa

浏览 5提问于2016-11-14得票数 0

回答已采纳

2回答

findElements(By.xpath(".//g") )在<svg>标签中不工作

、、、、

编辑:一位评论者正确地指出，事实上，我正在使用的HTML代码都在标记中，这似乎对这个特定的情况产生了决定性的影响。log.info(eventGroup.getAttribute("outerHTML&quo

浏览 7提问于2017-04-25得票数 3

回答已采纳

1回答

查找链接的XPath表达式提供"TypeError: Request必须是str或unicode，got“

、、

这是我的蜘蛛from lawn.items import LawnItemimport re # Defining rows to be scraped

浏览 1提问于2019-11-27得票数 0

回答已采纳

0回答

Scrapy + Splash:抓取内部html中的元素

、、

我正在使用Scrapy + Splash抓取网页，并试图从google广告横幅和其他广告中提取数据，但我很难让scrapy跟随xpath进入它们。scrapy经常遇到的脚本问题--它读取脚本的内容，而不是生成的html --但我似乎找不到一种方法来指明访问所需元素节点所需的XPath (ad的href链接)。如果我在google中检查元素并复制它的</em

浏览 11提问于2017-06-20得票数 1

回答已采纳

1回答

如何使用scrapy获取xlink:href/svg* id的名称？*

、、

我对scrapy完全是个新手，昨天才开始使用它。有一个页面上有我想要获得的产品的评级。不幸的是，收视率不是文本，而是明星。假设一个产品有两颗星，它看起来是这样的： <div class="index-classIcon index-red"> <path d=&q

浏览 2提问于2018-12-01得票数 0

2回答

Scrapy:如何在scrapy/wget已经下载的文件上使用XPath选择器？

、

我的项目涉及解析已经通过Scrapy或wget下载的文件。我知道我可以使用XPath选择器，但是到目前为止，我看到的示例涉及到在Scrapy的解析方法中调用XPath选择器，因此只对Scrapy下载的文件起作用。有没有一种方法可以直接对下载的文件使用XPath？我是Python和Scrapy的新手，所以我找不到在独立的<

浏览 2提问于2013-01-13得票数 0

1回答

如何在Scrapy中用tbody抓取这个HTML结构？

、、

" class="table table-striped table-bordered text-center table-condensed removeSidePadding" style="" xpath，除了Scrapy生成的样板代码之外，我没有太多要显示的内容。我一直在shell中专门工作，这样我就可以一个接一个地挑选这些元素，但我遇到的问题是空列表。我之前做过研究，发现scrapy不会拾取这些tbody标签，

浏览 51提问于2020-07-27得票数 0

2回答

抓取下一页的抓取循环

、、、

你好，我正在尝试进入单词抓取器和爬虫，但是我不明白为什么我的代码不能转到下一页和循环。import scrapy from scrapy import* for buyers in allbuy

浏览 27提问于2021-03-31得票数 0

回答已采纳

2回答

找不到SVG元素的Xpath

、、、

找不到SVG元素的xpath。下面是SVG的HTML部分<div _ngcontent-qqf-c17="" class="visual visual-card allow-deferred-rendering" focus-nav-mode="Gr

浏览 0提问于2019-11-04得票数 0

1回答

逐列输出数据，我想逐行刮擦。这怎么可能呢？

、、、

下面是蜘蛛的代码和图片如下所示： rows=response.xpath('//*[@id="table-timetable//tr/th/strong/text()').extract() item['Time'] = row.xpath('.//td/span[1]/text

浏览 5提问于2016-11-03得票数 0

回答已采纳

2回答

无法找到Chrome DevTools给出的DevTools

、、、、

当我在回答有关Selenium的问题时，正在试验一些 SVG路径时，我发现XPath在Chrome上有一种奇怪的行为(我没有在其他浏览器上尝试)。而这个做 //*[@id="chartdiv"]/div/

浏览 7提问于2014-11-13得票数 4

回答已采纳

1回答

如何解决下面的python-scrapy错误？

、

它在执行过程中没有显示错误，但我得到了一个空白文件，用于蜘蛛的output.My代码如下所示： from scrapy.selectorwww.timeanddate.com/worldclock/"] titles = response.selector.xpath("//tr/td[@a

浏览 2提问于2017-05-07得票数 1

回答已采纳

2回答

使用特定的<a>获取<span>

、、

我正在使用Scrapy从一个网站获取一些数据。我有以下链接：<a href="?isin=IT0000072618&lang=it&page=1"></a>我只想提取'a‘元素的href属性，该元素</e

浏览 6提问于2016-11-22得票数 0

回答已采纳

2回答

在scrapy和xpath中使用布尔()和count()之类的函数

、、、

因此，我试图使用xpath函数boolean()并使用scrapy提取真正的false响应，但是所有的scrapy返回都是u'0'。不管它是返回布尔值真还是布尔值:false scrapy总是返回基本上这是我的xpath</e

浏览 13提问于2017-07-19得票数 1

3回答

提供所有匹配元素的Scrapy xpath

我有一个HTML文件，我想从其中提取特定DIV下的锚点href值。) self.log(f'total records = {len(hrefElements)}') 我的问题是，为什么我需要使用中间选择变量来存储提取<

浏览 16提问于2022-03-29得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

这个Sprite SVG可以抓取吗？

如何让Python Scrapy跳过css规则和html属性

在包含"sometext“的网页中获取链接的xpath

Scrapy -找不到xpath元素

无法通过XPATH定位HighChart元素

findElements(By.xpath(".//g") )在<svg>标签中不工作

查找链接的XPath表达式提供"TypeError: Request必须是str或unicode，got“

Scrapy + Splash:抓取内部html中的元素

如何使用scrapy获取xlink:href/svg* id的名称？*

Scrapy:如何在scrapy/wget已经下载的文件上使用XPath选择器？

如何在Scrapy中用tbody抓取这个HTML结构？

抓取下一页的抓取循环

找不到SVG元素的Xpath

逐列输出数据，我想逐行刮擦。这怎么可能呢？

无法找到Chrome DevTools给出的DevTools

如何解决下面的python-scrapy错误？

使用特定的<a>获取<span>

在scrapy和xpath中使用布尔()和count()之类的函数

提供所有匹配元素的Scrapy xpath

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐