首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >为什么某些regex命令与不同的字符具有相反的“\”整数?

为什么某些regex命令与不同的字符具有相反的“\”整数?
EN

Unix & Linux用户
提问于 2011-02-17 20:23:30
回答 1查看 563关注 0票数 10

例如,以下命令:

代码语言:javascript
运行
复制
find . -regex ".*\.\(cpp\|h\)"

这将在您的目录中找到所有.h和.cpp文件。句号字符'.‘在正则表达式中,通常表示“任意字符”。若要使其只匹配实际句点,必须使用反斜杠字符“\”转义。

在这种情况下,给定一个具有特殊意义的字符,您必须转义它才能得到它所代表的实际字符。

现在,使用括号和“或”栏,分别是字符'(',‘)和’x‘。它们也具有特殊的意义,用于对正则表达式进行分组。然而,要获得特殊的意义,字符必须使用反斜杠转义!没有反斜杠,字符具有它所代表的实际字符的意义。

为什么“.”与'(',')',‘,’有不同的待遇?

EN

回答 1

Unix & Linux用户

回答已采纳

发布于 2011-02-17 20:42:42

答案其实是“仅仅是因为”。有很多不同的正则表达式语法,虽然它们有着相似的外观,而且基本元素通常是相同的,但它们在细节上各不相同。

历史上,每个工具都有自己的新实现,做作者认为最好的事情。在用转义和不转义使字符变得特殊之间有一种平衡--太多的字符是“自然特殊的”,因此您不得不一直对它们进行转义以匹配它们;或者,反过来,您最终需要一堆转义符才能使用普通的regex语法,比如()分组。每个编写程序的人都会根据他们的程序与之匹配的需要、他们觉得是正确的方法以及月球的相位来决定如何去做。

POSIX对"基本正则表达式“和"扩展正则表达式”的定义是标准化的尝试。令人震惊的是,这些工作在\方面彼此反向工作--有时,但不是完全一致的。

Perl正则表达式已经成为另一个事实上的标准,原因有两个:第一,它们非常灵活和强大;第二,它们实际上相当正常,具有"\总是逃避非字母数字字符“之类的约定。

GNU有一个-regextype选项,您可以在这里更改所使用的正则表达式语法。遗憾的是,"perl“不是一种选择,至少在find的版本中是这样的。(在GNU中,默认的是"emacs",语法是记录在这里。)

票数 12
EN
页面原文内容由Unix & Linux提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://unix.stackexchange.com/questions/7600

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档