我有一个:
“东方日报”是为伊利诺伊州查尔斯顿的东伊利诺伊大学社区出版的一份学生经营的报纸。该报纸创建于1915年的http://media/。www。新闻。com/media/storage/paper309/news/2005/11/04/News/The-News.转向90-1045667。shtml,在学年的工作日出版,夏天每周出版两次。
该报获得了许多州和全国奖项,包括几个心脏起搏器奖。http://search/.原子。com/search/?sp_a=sp01089f00&sp_f=iso-8859-1&sp_q=%22daily+eastern+news%22该报的编辑、制作和广告人员全部由来自不同学位课程的学生组成。
我想删除以上段落中粗体部分的空格。
预期输出:
“东方日报”是为伊利诺伊州查尔斯顿的东伊利诺伊大学社区出版的一份学生经营的报纸。该报纸成立于1915年http://media.www.dennews.com/media/storage/paper309/news/2005/11/04/News/The-News.Turns.90-1045667.shtml,在学年的工作日出版,夏天每周出版两次。
该报获得了许多州和全国奖项,包括几个心脏起搏器奖。http://search.atomz.com/search/?sp_a=sp01089f00&sp_f=iso-8859-1&sp_q=%22daily+eastern+news%22该报的编辑、制作和广告人员全部由来自不同学位课程的学生组成。
Regex我试过:
([(http://(.)\.)|(www\.)])\s
代之以
$1
发布于 2015-03-19 12:52:53
检查以下regex
搜索:
(?=\. [a-zA-Z1-9\. \-]*?com)\.
替换:
.
这将发现所有的.[space]
后面跟着一个com/,因为其中没有非英语字母,因为所有域通常都是英文字母或数字,这符合您的情况,但可能包括一些更多的字符,以确保所有域名涵盖如果您有更多的文本,并将.[space]
替换为一个点。
上面的解决方案只适用于http://‘之前的空格,如果您需要在url的完整字符串中替换所有出现的.[space]
(包括尾随路径),那么最好使用’部件,但是对于这一点,由于查找的后面是零大小的,我们需要首先执行字符串的反转
并将下面的regex应用于反向搜索部分,
(?=[a-zA-Z0-9\/ \.\-]+\/\/:ptth) \.
用.
替换它
然后再将字符串反转回来,这很容易实现用蟒蛇做的
https://stackoverflow.com/questions/29144871
复制相似问题