腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(8322)
视频
沙龙
2
回答
抓取
时
难以使用
Xpath
/
CSS
、
、
、
我以不同的方式尝试了
Xpath
和
CSS
: >>> response.
xpath
("//a[@class='category-navigation--link']/@href")[3].getall()['/en/monitors'] >>> response.
xpath
("//a[@class='category-navigation--l
浏览 22
提问于2019-03-14
得票数 0
回答已采纳
1
回答
从
xpath
/
css
获取输出的困难
、
、
、
、
下面是我正在
抓取
的一个示例链接:我正在尝试获取互联网号码,我尝试了
css
和
xpath
productOMS = product.
xpath
("//span[@id='product_ID']").getall()productOMS = product.
css
(".product_internet_number::text").getall() 下面是我想要
抓取
的html
浏览 4
提问于2020-03-05
得票数 0
回答已采纳
1
回答
为什么我从
css
和
xpath
选择器得到不同的答案?
、
、
、
我正在尝试使用scrapy
抓取
以下链接。给出 ['Comments filed by Southern CaliforniaCompany on 06/24/2021 Conf# 167430
浏览 0
提问于2021-06-28
得票数 0
1
回答
网络
抓取
新技术--是否可以使用路径定位
css
图像?
、
、
、
我对网络
抓取
是新的,我甚至缺乏基本的网络
抓取
/网络选择器的概念。是否可以使用
XPath
(使用selenium)定位
CSS
图像?我知道有一种通过
xpath
定位html图像元素的方法,但我不确定
CSS
中是否存在这种情况. 谢谢,
浏览 2
提问于2013-12-10
得票数 0
回答已采纳
1
回答
如何将
XPATH
值定义为R中html_nodes中的变量
、
、
在使用R (rvest)进行web
抓取
时
,我需要将
XPATH
值定义为html_nodes中的一个变量。这样我就可以迭代大量的
XPATH
。当我在外部定义
XPATH
时
,它会抛出错误(例如,当
xpath
=//*@id=“横幅”
时
出现错误)。你能帮帮我吗。我的守则:
xpath
<- as.character('//*[@id="title-overview-widget&q
浏览 3
提问于2016-03-05
得票数 2
回答已采纳
1
回答
如何使用Python从stat跟踪网站(cod.tracker.gg)中
抓取
正确的元素
、
、
、
我如何
抓取
“杀死”属性,例如使用网络
抓取
?(问题2.)更重要的是,如何获取本节中的杀人数量?我尝试过使用scrapy和
xpath
抓取
浏览 2
提问于2020-10-25
得票数 2
回答已采纳
1
回答
无法使用Scrapy从下拉列表中进行
抓取
、
、
、
我正在尝试从网站上嵌入的JS下拉列表中
抓取
市场列表:https://e27.co/startups 使用scrapy shell,我试图从“markets”下拉菜单中
抓取
市场列表,但无法这样做。在运行了scrapy shell 'https://e27.co/startups'之后,我尝试了同时使用response.
css
()和response.
xpath
()。对于
css
选择器: response.
css
(&
浏览 9
提问于2019-06-13
得票数 0
回答已采纳
1
回答
如何
抓取
脚本标签内的文字与刮痕?
、
我需要
抓取
脚本标记的内容作为文本,该脚本标记带有一个非常特定的属性,并带有scrapy库。response.
css
('script').attrib['type']
浏览 1
提问于2022-11-26
得票数 0
回答已采纳
2
回答
xpath
转义<>中的所有内容,如何解决这个问题?刮痕
、
、
、
当用Scrapy
抓取
时
,在使用<>而不是«»的字符串中刮取文本
时
,一切都会丢失。使用
xpath
和
css
选择器也会发生同样的情况。item = the_item.
css
('h3.class::text').get() item = the_item.
xpath
('//p[@class="class
浏览 0
提问于2019-08-18
得票数 1
回答已采纳
1
回答
如何使用R-selenium单击展开列表
、
现在我正在尝试从this website中
抓取
数据。我想使用selenium单击此"View all updates" button。我使用了SelectorGadget和
XPath
helper来查找
css
选择器和它的
xpath
,但是这两个都失败了。我的代码如下: loadmore <- remDr$findElement(using = '
css
selector', ".js-toggle-expand-updates") loadm
浏览 22
提问于2020-07-22
得票数 0
1
回答
链接的HTTP选择器(
xpath
或
css
)
、
、
、
我试图
抓取
这个站点中每一只鞋的href元素: response.
xpath
('.//*[@class="newnav itemnamelink"]')有人知道我如何在
xpath
或
css
中这样做吗?
浏览 1
提问于2017-03-05
得票数 1
回答已采纳
2
回答
抓取
包含文本nokogiri
xpath
的元素
、
、
、
、
仍在学习如何使用nokogiri,到目前为止可以通过
css
elements.There
抓取
是一个我想
抓取
的页面,我想获得所有的巴克莱英超联赛的结果,这可以通过Ajax调用来呈现,然而这是不可能的nokogiri所以我提供的链接有许多不同联赛的结果,所以我只能获取标题为英超联赛的结果,这些结果包含在到目前为止,我可以像这样
抓取
所有的结果.select{|th|th.text =~ /Barclay
浏览 0
提问于2013-05-11
得票数 1
回答已采纳
1
回答
Python selenium使用find_element_by点击按钮
、
、
、
、
我正在尝试从中
抓取
一些演讲稿,为了自动完成,我需要单击“下一步”按钮从所有页面中
抓取
。不幸的是,不管我使用的是什么类型的NoSuchElementException (by_
xpath
,by_
css
_selector,...),我总是得到一个find_element_by。下面是我尝试过的
XPath
和
CSS
选择器: driver.find_element_by_
css
_selector("li.pagination-next:nth-child(11) >
浏览 0
提问于2020-04-04
得票数 0
2
回答
Scrapy Crawler excel输出
、
、
、
、
我是python和scrapy的新手,但是我试图开发一个爬虫和
抓取
器来提取亚马逊页面上的产品列表, 我想要的是让每个产品及其对应的详细信息在每个单元格中清晰地输出。逻辑是这样的: for products in response.
xpath
('//*[@id="mainResults
浏览 4
提问于2017-01-23
得票数 0
1
回答
使用
xpath
支持的刮取框架
、
、
我在找一个网络
抓取
框架让我 有什么建议吗?我见过许多允许我使用
xpath
进行搜索的方法,但是没有一个能真正为元素生成
xpath
。
浏览 2
提问于2015-06-29
得票数 1
回答已采纳
1
回答
在使用Selenium的Python中单击按钮
、
、
、
我已经尝试了所有的
抓取
方法,但我不能点击not Now。
Xpath
从不工作,
CSS
selector..etc
浏览 0
提问于2021-06-12
得票数 2
1
回答
C#硒Web部件的自动化
、
、
、
、
我正在尝试手动编写一个SharePoint 2013文档库的自动化代码,并且在
抓取
省略号控件打开包含文档预览的and部件
时
遇到了问题。Selenium正在识别类名,这是文档库中所有省略号的相同值,而不是
XPath
或
CSS
值。我使用Selenium和FirePath来查找
XPath
值。 如有任何建议,将不胜感激。
浏览 1
提问于2015-09-15
得票数 0
回答已采纳
1
回答
Scrappy选择器上的Scrappy迭代
、
、
、
、
我正在尝试
抓取
一个使用调用HTML的API的网站,因此为此,我需要
抓取
API,然后从API
抓取
HTML结果 我已经使用这篇文章设法获得了API响应,并从中获得了HTML。json.loads(response.text) selector= scrapy.Selector(text=resp['results'], type="html") 而且它工作得很好,当我试图从页面获取属性
时
,我可以使用
CSS
或
Xpath
选择器来获取项 我现在要做的就是遍历
浏览 10
提问于2020-12-16
得票数 1
1
回答
协同欺骗-单击没有id的HREF
、
我们有一个链接表,每个链接都没有单独的id或
css
类。
XPath
到第五个链接是:(从工具
抓取
-保存
XPath
)我的testCept.php文件中的Click命令是: 但是,$没有在页面上找到按名称或
CSS
或
XPath
‘/*@id=“table_1_”/tbody/tr5/td2/
浏览 2
提问于2014-12-09
得票数 2
1
回答
Python3
抓取
网爬虫
、
、
、
、
对于我的工作,我必须写一个爬虫,它只保存页面的标题,交付状态和产品的数量。import scrapy name = "quotes" urls = [
浏览 2
提问于2020-07-20
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
python selenium系列(七)使用Chrome Console验证XPATH和CSS
BeatifulSoup,Xpath,CSS 选择器的性能比较
Chrome下F12自带的Xpath及CSS提取验证功能
零基础想学爬虫的看过来了!手把手从安装开始教你如何爬取网页!
码以致用02-用Scrapy 爬虫抓取简单心理咨询师资料
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券