抓取时难以使用Xpath/CSS

、、、

我以不同的方式尝试了Xpath和CSS： >>> response.xpath("//a[@class='category-navigation--link']/@href")[3].getall()['/en/monitors'] >>> response.xpath("//a[@class='category-navigation--l

浏览 22提问于2019-03-14得票数 0

回答已采纳

1回答

从xpath/css获取输出的困难

、、、、

下面是我正在抓取的一个示例链接：我正在尝试获取互联网号码，我尝试了css和xpathproductOMS = product.xpath("//span[@id='product_ID']").getall()productOMS = product.css(".product_internet_number::text").getall() 下面是我想要抓取的html

浏览 4提问于2020-03-05得票数 0

回答已采纳

1回答

为什么我从css和xpath选择器得到不同的答案？

、、、

我正在尝试使用scrapy抓取以下链接。给出 ['Comments filed by Southern CaliforniaCompany on 06/24/2021 Conf# 167430

浏览 0提问于2021-06-28得票数 0

1回答

网络抓取新技术--是否可以使用路径定位css图像？

、、、

我对网络抓取是新的，我甚至缺乏基本的网络抓取/网络选择器的概念。是否可以使用XPath (使用selenium)定位CSS图像？我知道有一种通过xpath定位html图像元素的方法，但我不确定CSS中是否存在这种情况. 谢谢,

浏览 2提问于2013-12-10得票数 0

回答已采纳

1回答

如何将XPATH值定义为R中html_nodes中的变量

、、

在使用R (rvest)进行web抓取时，我需要将XPATH值定义为html_nodes中的一个变量。这样我就可以迭代大量的XPATH。当我在外部定义XPATH时，它会抛出错误(例如，当xpath =//*@id=“横幅”时出现错误)。你能帮帮我吗。我的守则： xpath <- as.character('//*[@id="title-overview-widget&q

浏览 3提问于2016-03-05得票数 2

回答已采纳

1回答

如何使用Python从stat跟踪网站(cod.tracker.gg)中抓取正确的元素

、、、

我如何抓取“杀死”属性，例如使用网络抓取？(问题2.)更重要的是，如何获取本节中的杀人数量？我尝试过使用scrapy和xpath抓取

浏览 2提问于2020-10-25得票数 2

回答已采纳

1回答

我正在尝试从网站上嵌入的JS下拉列表中抓取市场列表：https://e27.co/startups 使用scrapy shell，我试图从“markets”下拉菜单中抓取市场列表，但无法这样做。在运行了scrapy shell 'https://e27.co/startups'之后，我尝试了同时使用response.css()和response.xpath()。对于css选择器： response.css(&

浏览 9提问于2019-06-13得票数 0

回答已采纳

1回答

如何抓取脚本标签内的文字与刮痕？

、

我需要抓取脚本标记的内容作为文本，该脚本标记带有一个非常特定的属性，并带有scrapy库。response.css('script').attrib['type']

浏览 1提问于2022-11-26得票数 0

回答已采纳

2回答

xpath转义<>中的所有内容，如何解决这个问题？刮痕

、、、

当用Scrapy抓取时，在使用<>而不是«»的字符串中刮取文本时，一切都会丢失。使用xpath和css选择器也会发生同样的情况。item = the_item.css('h3.class::text').get() item = the_item.xpath('//p[@class="class

浏览 0提问于2019-08-18得票数 1

回答已采纳

1回答

如何使用R-selenium单击展开列表

、

现在我正在尝试从this website中抓取数据。我想使用selenium单击此"View all updates" button。我使用了SelectorGadget和XPath helper来查找css选择器和它的xpath，但是这两个都失败了。我的代码如下： loadmore <- remDr$findElement(using = 'css selector', ".js-toggle-expand-updates") loadm

浏览 22提问于2020-07-22得票数 0

1回答

链接的HTTP选择器(xpath或css)

、、、

我试图抓取这个站点中每一只鞋的href元素： response.xpath('.//*[@class="newnav itemnamelink"]')有人知道我如何在xpath或css中这样做吗？

浏览 1提问于2017-03-05得票数 1

回答已采纳

2回答

抓取包含文本nokogiri xpath的元素

、、、、

仍在学习如何使用nokogiri，到目前为止可以通过css elements.There抓取是一个我想抓取的页面，我想获得所有的巴克莱英超联赛的结果，这可以通过Ajax调用来呈现，然而这是不可能的nokogiri所以我提供的链接有许多不同联赛的结果，所以我只能获取标题为英超联赛的结果，这些结果包含在到目前为止，我可以像这样抓取所有的结果.select{|th|th.text =~ /Barclay

浏览 0提问于2013-05-11得票数 1

回答已采纳

1回答

Python selenium使用find_element_by点击按钮

、、、、

我正在尝试从中抓取一些演讲稿，为了自动完成，我需要单击“下一步”按钮从所有页面中抓取。不幸的是，不管我使用的是什么类型的NoSuchElementException (by_xpath，by_css_selector，...)，我总是得到一个find_element_by。下面是我尝试过的XPath和CSS选择器： driver.find_element_by_css_selector("li.pagination-next:nth-child(11) >

浏览 0提问于2020-04-04得票数 0

2回答

Scrapy Crawler excel输出

、、、、

我是python和scrapy的新手，但是我试图开发一个爬虫和抓取器来提取亚马逊页面上的产品列表，我想要的是让每个产品及其对应的详细信息在每个单元格中清晰地输出。逻辑是这样的： for products in response.xpath('//*[@id="mainResults

浏览 4提问于2017-01-23得票数 0

1回答

使用xpath支持的刮取框架

、、

我在找一个网络抓取框架让我有什么建议吗？我见过许多允许我使用xpath进行搜索的方法，但是没有一个能真正为元素生成xpath。

浏览 2提问于2015-06-29得票数 1

回答已采纳

1回答

在使用Selenium的Python中单击按钮

、、、

我已经尝试了所有的抓取方法，但我不能点击not Now。Xpath从不工作，CSS selector..etc

浏览 0提问于2021-06-12得票数 2

1回答

C#硒Web部件的自动化

、、、、

我正在尝试手动编写一个SharePoint 2013文档库的自动化代码，并且在抓取省略号控件打开包含文档预览的and部件时遇到了问题。Selenium正在识别类名，这是文档库中所有省略号的相同值，而不是XPath或CSS值。我使用Selenium和FirePath来查找XPath值。如有任何建议，将不胜感激。

浏览 1提问于2015-09-15得票数 0

回答已采纳

1回答

Scrappy选择器上的Scrappy迭代

、、、、

我正在尝试抓取一个使用调用HTML的API的网站，因此为此，我需要抓取API，然后从API抓取HTML结果我已经使用这篇文章设法获得了API响应，并从中获得了HTML。json.loads(response.text) selector= scrapy.Selector(text=resp['results'], type="html") 而且它工作得很好，当我试图从页面获取属性时，我可以使用CSS或Xpath选择器来获取项我现在要做的就是遍历

浏览 10提问于2020-12-16得票数 1

1回答