使用正则表达式从URL获取字符串的方法如下:
^(https?|ftp)://[^\s/$.?#].[^\s]*$
^
表示匹配字符串的开始位置。(https?|ftp)
表示匹配以 http
或 https
或 ftp
开头的字符串。://
表示匹配 ://
字符。[^\s/$.?#]
表示匹配除空格、/
、$
、.
、?
、#
之外的任意字符。.
表示匹配 .
字符。[^\s]*
表示匹配除空格之外的任意字符。$
表示匹配字符串的结束位置。import re
def get_string_from_url(url):
pattern = r'^(https?|ftp)://[^\s/$.?#].[^\s]*$'
match = re.search(pattern, url)
if match:
return match.group()
else:
return None
# 示例用法
url = 'https://www.example.com/path/to/page'
result = get_string_from_url(url)
print(result) # 输出:https://www.example.com/path/to/page
re.search()
函数用于在字符串中搜索匹配正则表达式模式的内容。如果找到匹配项,则返回一个 Match
对象,可以通过调用 group()
方法获取匹配的字符串。如果没有找到匹配项,则返回 None
。领取专属 10元无门槛券
手把手带您无忧上云