文章/答案/技术大牛

发布

社区首页 >问答首页 >Regex格式化不带空格的url格式

问Regex格式化不带空格的url格式
EN

Stack Overflow用户

提问于 2015-03-19 12:40:56

回答 1查看 469关注 0票数 2

我有一个:

“东方日报”是为伊利诺伊州查尔斯顿的东伊利诺伊大学社区出版的一份学生经营的报纸。该报纸创建于1915年的http://media/。www。新闻。com/media/storage/paper309/news/2005/11/04/News/The-News.转向90-1045667。shtml，在学年的工作日出版，夏天每周出版两次。

该报获得了许多州和全国奖项，包括几个心脏起搏器奖。http://search/.原子。com/search/?sp_a=sp01089f00&sp_f=iso-8859-1&sp_q=%22daily+eastern+news%22该报的编辑、制作和广告人员全部由来自不同学位课程的学生组成。

我想删除以上段落中粗体部分的空格。

预期输出：

“东方日报”是为伊利诺伊州查尔斯顿的东伊利诺伊大学社区出版的一份学生经营的报纸。该报纸成立于1915年http://media.www.dennews.com/media/storage/paper309/news/2005/11/04/News/The-News.Turns.90-1045667.shtml，在学年的工作日出版，夏天每周出版两次。

该报获得了许多州和全国奖项，包括几个心脏起搏器奖。http://search.atomz.com/search/?sp_a=sp01089f00&sp_f=iso-8859-1&sp_q=%22daily+eastern+news%22该报的编辑、制作和广告人员全部由来自不同学位课程的学生组成。

Regex我试过:

([(http://(.)\.)|(www\.)])\s

代之以

$1

python

regex

expression

回答 1

Stack Overflow用户

发布于 2015-03-19 12:52:53

检查以下regex

搜索:

(?=\. [a-zA-Z1-9\. \-]*?com)\.

替换:

这将发现所有的.[space]后面跟着一个com/，因为其中没有非英语字母，因为所有域通常都是英文字母或数字，这符合您的情况，但可能包括一些更多的字符，以确保所有域名涵盖如果您有更多的文本，并将.[space]替换为一个点。

上面的解决方案只适用于http://‘之前的空格，如果您需要在url的完整字符串中替换所有出现的.[space] (包括尾随路径)，那么最好使用’部件，但是对于这一点，由于查找的后面是零大小的，我们需要首先执行字符串的反转

并将下面的regex应用于反向搜索部分，

 (?=[a-zA-Z0-9\/ \.\-]+\/\/:ptth) \.

用.替换它

然后再将字符串反转回来，这很容易实现用蟒蛇做的

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/29144871

复制

相似问题

问Regex格式化不带空格的url格式
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Regex格式化不带空格的url格式EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问Regex格式化不带空格的url格式
EN