XPATH:选择子节点不包含某些文本的节点

XPATH是一种用于在XML文档中定位节点的查询语言。它可以通过路径表达式来选择节点，并且可以使用谓语来过滤节点。在选择子节点时，可以使用谓语来排除包含某些文本的节点。

XPATH的语法包括以下几个部分：

节点选择器：用于选择节点的类型，例如选择元素节点、属性节点、文本节点等。
路径表达式：用于指定节点的路径，可以使用绝对路径或相对路径。
谓语：用于过滤节点，可以使用条件表达式来判断节点是否满足条件。

对于选择子节点不包含某些文本的节点，可以使用以下的XPATH表达式：

//节点名称[not(contains(., '某些文本'))]

其中，//表示从根节点开始搜索，节点名称表示要选择的节点名称，not(contains(., '某些文本'))表示节点的文本内容不包含某些文本。

这样的XPATH表达式可以用于在XML文档中选择不包含某些文本的特定节点。例如，如果我们有一个XML文档如下：

<root>
  <node>节点1</node>
  <node>节点2</node>
  <node>节点3</node>
</root>

我们可以使用以下的XPATH表达式来选择不包含"节点2"文本的节点：

//node[not(contains(., '节点2'))]

这将选择到<node>节点1</node>和<node>节点3</node>这两个节点。

对于腾讯云相关产品和产品介绍链接地址，由于要求不能提及具体的云计算品牌商，我无法提供具体的链接。但是，腾讯云作为一家知名的云计算服务提供商，提供了丰富的云计算产品和解决方案，可以通过访问腾讯云官方网站来了解更多相关信息。

相关·内容

xpath库详解xpath入门获取所有节点子节点父节点 ..属性匹配 @文本获取按序选择节点轴选择

>, ] 子节点 / 获取li节点的直接子节点 from lxml import etree.../test.html', etree.HTMLParser()) result = html.xpath('//li/a') # 获取所有li节点的直接子节点a print(result) [<Element.../test.html', etree.HTMLParser()) # 获取所有li的子节点a的属性href result = html.xpath('//li/a/@href') print(result.../test.html', etree.HTMLParser()) # 获取属性class值为item-0的li的子节点a的文本内容 result = html.xpath('//li[@class="item.../test.html', etree.HTMLParser()) # 获取所有li的后代节点中的文本 result = html.xpath('//li//text()') print(result)

24.6K5 1

JavaScript 技术篇-js只获取本节点text文本，不包含子节点

innerText 和 textContent 都是获取所有节点的 firstChild.nodeValue 是获取本节点的text文本，不包含子节点的。 ?

6.3K2 0

JavaScript 技术篇 - js在一个元素节点下包含多个text文本情况下的指定文本提取方法

结构如下，该元素下包含两个 text 文本，我们只想提取第一个文本内容。常规的 innertext、textContent 和 outerText 方法只能提取到全部的文本。...可以通过 childNodes[索引] 来指定 text 文本来进行提取。当然，childNodes[索引] 返回的是对象，再加个 nodeValue 就能返回文本了。

2.1K3 0

Python爬虫Xpath库详解

因为 XPath 中 text 方法前面是 /，而此处 / 的含义是选取直接子节点，很明显 li 的直接子节点都是 a 节点，文本都是在 a 节点内部的，所以这里匹配到的结果就是被修正的 li 节点内部的换行符...可想而知，这里是选取所有子孙节点的文本，其中前两个就是 li 的子节点 a 节点内部的文本，另外一个就是最后一个 li 节点内部的文本，即换行符。...如果想获取某些特定子孙节点下的所有文本，可以先选取到特定的子孙节点，然后再调用 text 方法方法获取其内部文本，这样可以保证获取的结果是整洁的。 10....按序选择有时候，我们在选择的时候某些属性可能同时匹配了多个节点，但是只想要其中的某个节点，如第二个节点或者最后一个节点，这时该怎么办呢？...第五次选择时，我们调用了 descendant 轴，可以获取所有子孙节点。这里我们又加了限定条件获取 span 节点，所以返回的结果只包含 span 节点而不包含 a 节点。

2441 0

学会XPath，轻松抓取网页数据

XPath的节点是指在XML或HTML文档中被选择的元素或属性。XPath中有7种类型的节点，包括元素节点、属性节点、文本节点、命名空间节点、处理指令节点、注释节点以及文档节点（或称为根节点）。...在XPath中，可以使用text()函数来选择文本节点，例如：//p/text()表示选择所有元素中的文本内容。- 命名空间节点：表示XML文档中的命名空间。...category='fiction'>中的category属性node()匹配任何类型的节点//book/node() 选取元素下的所有类型的子节点，包括元素节点、文本节点、注释节点等以及使用谓词来进一步筛选选择的节点集...string 是节点的文本内容，substring 是要查找的子字符串//book[contains(title, 'XML')] 选取标题中包含子字符串'XML'的元素[starts-with...条件语句：XPath提供了条件语句（如if-else语句），使得我们可以根据某些条件来选择性地提取元素或属性3。

7761 0

学爬虫利器Xpath，看这一篇就够了（建议收藏）

因为Xpath中text()前面是/，而此处/的含义是选取直接子节点，很明显li的直接子节点都是a节点，文本都是在a节点内部，所以这里匹配到的结果就是被修正的li节点内部的换行符，因为自动修正的li节点的尾标签换行了...分析可知，这里是选取所有子孙节点的文本，其中前面两个就是li的子节点a节点内部的文本，另一个就是最后一个li节点内部的文本，即换行符。...如果想获取某些特定子孙节点下的所有文本，可以先选取到特定的子孙节点，然后再调用text（）方法获取其内部文本，这样可以保证获取到的结果是整洁的。 6.获取属性这里我们用@符号就可以获取节点属性。...9.按序选择有时候，我们在选择的时候某些属性可能同时匹配了多个节点，但是只想要其中的某个节点，如第二个节点或者最后一个节点，这时该怎么办呢？...它们的具体作用可以参考：http://www.w3school.com.cn/xpath/xpath_functions.asp. 10.节点轴选择 Xpath提供了很多节点轴选择方法，包括获取子元素、

1.3K4 0

Xpath学习笔记，持续记录

/xpath/index.asp Xpath术语 1.节点在 XPath 中，有七种类型的节点：元素、属性、文本、命名空间、处理指令、注释以及文档节点（或称为根节点）。...在 XPath 中，节点关系可分为：父节点、祖先节点、同胞节点、子节点、后代节点； Xpath语法 1.基本语法 XPath 使用路径表达式来选取 XML 文档中的节点或节点集。...(/html//div[1])，节点名称 //选择不包含class属性的节点 var result = node.SelectNodes("....//span[not(@class)]"); //选择不包含class和id属性的节点 var result = node.SelectNodes("....//span[not(@class) and not(@id)]"); //选择不包含class="expire"的span var result = node.SelectNodes(".

8664 0

Python3网络爬虫实战-28、解析库

选取当前节点的父节点 @ 选取属性在这里列出了XPath的常用匹配规则，例如 / 代表选取直接子节点，// 代表选择所有子孙节点，. 代表选取当前节点，.....因为 XPath 中 text() 前面是 /，而此 / 的含义是选取直接子节点，而此处很明显 li 的直接子节点都是 a 节点，文本都是在 a 节点内部的，所以这里匹配到的结果就是被修正的 li 节点内部的换行符...如果我们想获取某些特定子孙节点下的所有文本，可以先选取到特定的子孙节点，然后再调用 text() 方法获取其内部文本，这样可以保证获取的结果是整洁的。 10....按序选择有时候我们在选择的时候可能某些属性同时匹配了多个节点，但是我们只想要其中的某个节点，如第二个节点，或者最后一个节点，这时该怎么办呢？...节点轴选择 XPath 提供了很多节点轴选择方法，英文叫做 XPath Axes，包括获取子元素、兄弟元素、父元素、祖先元素等等，在一定情况下使用它可以方便地完成节点的选择，我们用一个实例来感受一下：

2.3K2 0

学爬虫利器XPath,看这一篇就够了

@选取属性在这里列出了XPath的常用匹配规则，例如 / 代表选取直接子节点，// 代表选择所有子孙节点，....因为 XPath 中 text() 前面是 /，而此 / 的含义是选取直接子节点，而此处很明显 li 的直接子节点都是 a 节点，文本都是在 a 节点内部的，所以这里匹配到的结果就是被修正的 li 节点内部的换行符...如果我们想获取某些特定子孙节点下的所有文本，可以先选取到特定的子孙节点，然后再调用 text() 方法获取其内部文本，这样可以保证获取的结果是整洁的。 10....按序选择有时候我们在选择的时候可能某些属性同时匹配了多个节点，但是我们只想要其中的某个节点，如第二个节点，或者最后一个节点，这时该怎么办呢？...节点轴选择 XPath 提供了很多节点轴选择方法，英文叫做 XPath Axes，包括获取子元素、兄弟元素、父元素、祖先元素等等，在一定情况下使用它可以方便地完成节点的选择，我们用一个实例来感受一下：

1.9K2 1

左手用R右手Python系列16——XPath与网页解析库

如果这里不赋值，我们只是选择了所有含有term属性的节点。 xpathSApply(content,"//entry/category[@term]",xmlGetAttr,"scheme") ?...3、匹配操作：文本谓语中可以执行特殊的匹配操作，功能类似于Excel中的left、right以及mid函数。就是匹配文本中以什么开始、结束或者包含有某些文本的记录。...这里的*号指代所有可能的路径，因而第一句函数意思就是在所有可能的路径中搜寻具有子节点id的节点内容。...如果这里不赋值，我们只是选择了所有含有term属性的节点的scheme属性内容，一共有82条之多。...3、匹配操作：文本谓语中可以执行特殊的匹配操作，功能类似于Excel中的left、right以及mid函数。就是匹配文本中以什么开始、结束或者包含有某些文本的记录。

2.4K5 0

python爬虫系列之 xpath：html解析神器

的选择器，通过 id、css选择器和标签来查找元素，xpath主要通过 html节点的嵌套关系来查找元素，和文件的路径有点像，比如： #获取 id为 tab的 table标签下所有 tr标签 path...这样就能保证我们总是能获得一个包含文档节点的_Element对象。...xpath语法 a / b ：‘/’在 xpath里表示层级关系，左边的 a是父节点，右边的 b是子节点，这里的 b是 a的直接子节点 a // b：两个 / 表示选择所有 a节点下的 b节点（可以是直接子节点...//a[contains(@href, "#1233")]' //a[contains(@y, "x")]：选择有 y属性且 y属性包含 x值的 a标签总结使用 xpath之前必须先对 html...文档进行处理 html dom树中所有的对象都是节点，包括文本，所以 text()其实就是获取某个标签下的文本节点通过_Element对象的 xpath方法来使用 xpath 注意！！！

2.2K3 0

selenium xpath定位

$' xpath节点在xpath中，有七种类型的节点(node)：元素、属性、文本、命名空间、处理指令、注释以及文档节点（或称为根节点）在开始xpath语法前，我们需要简单了解这几种节点：节点名称...\，id即为div节点的属性文本节点标签的文本如\啦啦啦\，'啦啦啦'即为div节点的文本 xpath语法...选择所有id='kw'并且class='s_ipt'的节点 contains() 包含 //*contains...(text(), '新闻') 选择所有文本带有'新闻'二字的节点 starts-with() 头部包含...//*starts-with(@id, 's') 选择所有文本以'新闻'开头的节点备注： last()、position()、text()、not()这类带有括号的表达式

1.1K0 0

软件测试人工智能|详解selenium xpath定位

\，id即为div节点的属性文本节点标签的文本如\啦啦啦\，'啦啦啦'即为div节点的文本xpath语法中的所有\子节点/...() 最后一个节点 //divlast() 选择所有\节点且该节点是其父级的最后一个子节点...), '新闻') 选择所有文本带有'新闻'二字的节点starts-with() 头部包含 //...*starts-with(@id, 's') 选择所有文本以'新闻'开头的节点备注：last()、position()、text()、not()这类带有括号的表达式

2833 1

Xpath、Jsoup、Xsoup(我的Java爬虫之二)

从Xpath说起什么是Xpath XPath是W3C的一个标准。它最主要的目的是为了在XML1.0或XML1.1文档节点树中定位节点所设计。...XPath是一种表达式语言，它的返回值可能是节点，节点集合，原子值，以及节点和原子值的混合等。...语法选取结点表达式描述 / 从根节点选取 // 从匹配选择的当前节点选择文档中的节点，而不考虑它们的位置。 . 选取当前结点 .....:not(selector): 查找与选择器不匹配的元素，比如： div:not(.logo) 表示不包含 class=logo 元素的所有 div 列表 :contains(text): 查找包含给定文本的元素...，搜索不区分大不写，比如： p:contains(jsoup) :containsOwn(text): 查找直接包含给定文本的元素 :matches(regex): 查找哪些元素的文本匹配指定的正则表达式

1.7K2 0

软件测试|selenium xpath定位

，则使用单引号，'$'可更换为'$$'xpath节点在xpath中，有七种类型的节点(node)：元素、属性、文本、命名空间、处理指令、注释以及文档节点（或称为根节点）在开始xpath语法前，我们需要简单了解这几种节点...\，id即为div节点的属性文本节点标签的文本如\啦啦啦\，'啦啦啦'即为div节点的文本xpath语法中的所有\子节点/...), '新闻') 选择所有文本带有'新闻'二字的节点starts-with() 头部包含 //...*starts-with(@id, 's') 选择所有文本以'新闻'开头的节点备注：last()、position()、text()、not()这类带有括号的表达式

8521 0

Python之xpath

comment（注释）　　- root（根节点） xpath表达式格式　　xpath通过”路径表达式”来选择节点，在表现形式上与传统的文件系统类似　　绝对路径（absolute path）必须用...　　”/”：表示选择根节点　　”//”：表示选择任意位置的某个节点　　”@”：表示选择某个属性　　nodename（节点名称）：表示选择该节点的所有子节点 xpath功能函数使用功能函数能够更好的进行模糊搜索...(@id,”ma”)]‘) 选取id值包含ma的div节点 and xpath(‘//div[contains(@id,”ma”) and contains(@id,”in”)]‘) 选取id值包含ma...和in的div节点 text() xpath(‘//div[contains(text(),”ma”)]‘) 选取节点文本包含ma的div节点 xpath定位方法 <?...#/bookstore/book[position()<3] ：表示选择bookstore的前两个book子元素。 #//title[@lang] ：表示选择所有具有lang属性的title节点。

4532 0

关于python中的xpath解析定位

爬取的网站：http://jbk.39.net/chancegz/ 这里只针对个别属性值： #例如：'别名'下的span标签文本，‘发病部位'下的span标签文本以及‘挂号科室‘下的span标签文本...//li[@class="liClass"] | //div[@class="liClass"]')) xpath基本语法表达式说明 article 选取所有article元素的所有子节点 /article...following-sibling::div[1] 前N位： preceding-sibling::div[N] 后N位： following-sibling::div[N] # 爬取i标签中包含相关检查节点的兄弟...a节点（找到i节点— 找到其父节点- 找到该父节点的子节点a） content = tree.xpath('//i[contains(text(),"相关检查：")]/.....")]/h3 选择不包含某一属性的节点 //div[not(@class)] 没有class属性的div //tbody/tr[not(@class or @id)] 获取当前节点的是什么类型的html

2.1K4 0

XML文档节点导航与选择指南

包含200多个内置函数： XPath包含200多个内置函数，可用于处理字符串、数值、布尔值、日期和时间等。...具有XPath知识可以充分发挥XSLT的强大功能XPath节点在XPath中，有七种节点：元素、属性、文本、命名空间、处理指令、注释和根节点。XML文档被视为节点树，树的最顶层元素称为根元素。...XPath术语节点（Node）：在XPath中，有七种节点，包括元素、属性、文本、命名空间、处理指令、注释和根节点。XML文档被视为节点树，树的最顶层元素称为根元素。...后代节点（Descendant Node）：节点的子节点、子节点的子节点等。XPath语法XPath使用路径表达式在XML文档中选择节点。.../child::*：选择当前节点的所有元素子节点。/attribute::*：选择当前节点的所有属性。/child::text()：选择当前节点的所有文本节点子节点。

1050 0

python学习之xpath使用案例总结

*:匹配任何元素节点 8，@*:匹配任何属性节点 9，node()：匹配任何类型的节点 10，| ：选取若干个路径 xpath谓语的用法：谓语用来查找某个特定的节点或者包含某个指定的值的节点。...()<3]：选取根节点的子节点最前面的两个div元素 //div[@id]：选取所有div包含id属性的元素 //div[@id=’kw’]：选取所有div包含id属性等于kw的元素 xpath 轴在...：选择文本中当前节点结束标签后的所有节点 namespace：选取当前节点的所有命名空间节点 parent：选取当前节点的父节点 preceding：选取文档中当前节点的开始标签之前的所有节点 preceding-sibling...child::*：选取当前节点的所有子元素 attribute::*：选取当前节点的所有属性 child::text()：选取当前节点的所有文本子节点 child::node()：选取当前节点的所有子节点...2 mod 1，余0 ''' #通过text()定位到标签包含文本内容的位置，利用contains(text(),"文本内容")函数包含关键词文本内容，还可以直接等于文本内容，如：/div[text(

1.2K1 0

web自动化测试入门篇06 —— 元素定位进阶技巧

类】的组合方式来进行元素定位对于前面介绍的后代选择器来说，子选择器和其的区别在于：子选择器只会选择直接子元素，而后代选择器则可以选择所有子孙元素。...driver.find_element(By.XPATH, "//input[@name='discount']")【包含】contains() 函数用于匹配元素的属性值是否包含指定的字符串。...轴 —— 选择当前节点的所有子节点preceding-sibling 轴 —— 选择当前节点之前的所有兄弟节点following-sibling 轴 —— 选择当前节点之后的所有兄弟节点self 轴...contains()这个函数用来检查元素中的文本内容是否包含指定的字符串。...driver.find_element(By.XPATH, "//div[contains(text(), 'fill')]")这里我们使用contains来检查div元素的文本内容是否包含fill。

7694 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云