例如,以下命令:
find . -regex ".*\.\(cpp\|h\)"
这将在您的目录中找到所有.h和.cpp文件。句号字符'.‘在正则表达式中,通常表示“任意字符”。若要使其只匹配实际句点,必须使用反斜杠字符“\”转义。
在这种情况下,给定一个具有特殊意义的字符,您必须转义它才能得到它所代表的实际字符。
现在,使用括号和“或”栏,分别是字符'(',‘)和’x‘。它们也具有特殊的意义,用于对正则表达式进行分组。然而,要获得特殊的意义,字符必须使用反斜杠转义!没有反斜杠,字符具有它所代表的实际字符的意义。
为什么“.”与'(',')',‘,’有不同的待遇?
发布于 2011-02-17 20:42:42
答案其实是“仅仅是因为”。有很多不同的正则表达式语法,虽然它们有着相似的外观,而且基本元素通常是相同的,但它们在细节上各不相同。
历史上,每个工具都有自己的新实现,做作者认为最好的事情。在用转义和不转义使字符变得特殊之间有一种平衡--太多的字符是“自然特殊的”,因此您不得不一直对它们进行转义以匹配它们;或者,反过来,您最终需要一堆转义符才能使用普通的regex语法,比如()分组。每个编写程序的人都会根据他们的程序与之匹配的需要、他们觉得是正确的方法以及月球的相位来决定如何去做。
POSIX对"基本正则表达式“和"扩展正则表达式”的定义是标准化的尝试。令人震惊的是,这些工作在\
方面彼此反向工作--有时,但不是完全一致的。
Perl正则表达式已经成为另一个事实上的标准,原因有两个:第一,它们非常灵活和强大;第二,它们实际上相当正常,具有"\总是逃避非字母数字字符“之类的约定。
GNU有一个-regextype
选项,您可以在这里更改所使用的正则表达式语法。遗憾的是,"perl“不是一种选择,至少在find的版本中是这样的。(在GNU中,默认的是"emacs",语法是记录在这里。)
https://unix.stackexchange.com/questions/7600
复制相似问题