要找出URL是否包含img或其他文件,可以使用正则表达式来匹配URL中的文件类型。以下是一个示例代码,可以帮助你实现这个功能:
import re
def check_url(url):
# 匹配URL中的文件类型
file_types = re.findall(r'\.(\w+)$', url)
if 'img' in file_types:
return True
else:
return False
# 示例用法
url1 = 'https://example.com/image.jpg'
url2 = 'https://example.com/document.pdf'
if check_url(url1):
print('URL包含图片文件')
else:
print('URL不包含图片文件')
if check_url(url2):
print('URL包含图片文件')
else:
print('URL不包含图片文件')
上述代码使用正则表达式 \.\w+$
来匹配URL中的文件类型,然后判断是否包含img文件类型。如果包含img文件类型,则返回True,否则返回False。
如果你只想下载图片文件,可以在代码中添加相应的逻辑来实现。以下是一个示例代码,可以帮助你实现只下载图片的功能:
import requests
import re
def download_image(url, save_path):
response = requests.get(url)
# 获取文件名
file_name = re.findall(r'/([^/]+)$', url)[0]
# 判断文件类型是否为图片
file_type = re.findall(r'\.(\w+)$', file_name)[0]
if file_type.lower() not in ['jpg', 'jpeg', 'png', 'gif']:
print('文件类型不是图片,无法下载')
return
# 保存图片
with open(save_path + file_name, 'wb') as f:
f.write(response.content)
print('图片下载完成')
# 示例用法
url1 = 'https://example.com/image.jpg'
url2 = 'https://example.com/document.pdf'
save_path = '/path/to/save/'
download_image(url1, save_path)
download_image(url2, save_path)
上述代码使用requests库来发送HTTP请求,并使用正则表达式来判断文件类型是否为图片。如果文件类型是图片,则将其保存到指定的路径中。
请注意,以上代码仅为示例,实际应用中可能需要根据具体需求进行适当的修改和优化。
没有搜到相关的沙龙
领取专属 10元无门槛券
手把手带您无忧上云