1. 正则表达式简介
正则表达式(regular expression)使用单个字符串来描述、匹配一系列符合某个句法规则的字符串;
说简单点,正则表达式就是在一堆有规律的字符中找到你想要的字符;
正则表达式在几乎所有语言中都可以使用,Java、c#、bash,Python,语法几乎一致
2.元字符简介
元字符是一些在正则表达式里有着特殊含义的字符,(如:.,[,],等),他们无法表达自身,因此需要用\对他们进行转义。
2.1 空白元字符
[\f] 换页符 [\n] 换行符 [\r] 回车符 [\t] 制表符(Tab键) [\v] 垂直制表符
阮一峰的日志中说明了回车(CR)和换行(LF)的由来。
Linux 系列操作系统中每行结尾是:\n Windows 操作系统每行结尾:\r\n 老的Mac系统(Mac OS, OS X): \r 新的Mac系统(macOS): \n
2.2 匹配特定字符类别
3. 正则表表达式实例
匹配8-10位数字的QQ号码:1014035350
匹配1开头11位数字的手机号码:13777368811
匹配以a开头的,0个或多个b结尾的字符串:a或abb
匹配空行
匹配空格 abc def
匹配自己的用户名 test0001
4. 在Notepad++中练习正则表达式
1. 打开文本
2. CTRL+F 打开查找
3. 查找模式里勾选正则表达式
4.1 完整复制PDF中的一段文字
从PDF里复制一段文字输入谷歌翻译框翻译,由于换行符存在,翻译不完整!
将文字复制到Notepad++,打开显示行尾符功能,每行行末的CR LF黑字符 说明存在回车和换行符,即每行结尾有\r\n。可以使用Notepad++正则表达式替换功能将\r\n替换成空格。
去除空格后谷歌翻译的效果图如下。
4.2 将文本文件转换为Excel能打开的csv文件
每列数据若用空格分隔,可以使用正则表达式[ \t]+将制表符和空格符替换成逗号,另存为csv文件,就可以用EXCEL打开。
4.3 文件搜索软件 Everything+正则表达式
5. Notepad++列块编辑模式
在编辑选项卡中把多列编辑下载选框选中,此为按住ctrl+鼠标点击编辑多列的功能。按住 Ctrl用鼠标左键选择多列然后输入想要的字符或者进行编辑了。可以选择某一列的数据,复制粘贴到EXCEL。
领取专属 10元无门槛券
私享最新 技术干货