首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

如何找出url是否包含img或其他文件?如何排除这些文件,只下载图片?

要找出URL是否包含img或其他文件,可以使用正则表达式来匹配URL中的文件类型。以下是一个示例代码,可以帮助你实现这个功能:

代码语言:txt
复制
import re

def check_url(url):
    # 匹配URL中的文件类型
    file_types = re.findall(r'\.(\w+)$', url)
    
    if 'img' in file_types:
        return True
    else:
        return False

# 示例用法
url1 = 'https://example.com/image.jpg'
url2 = 'https://example.com/document.pdf'

if check_url(url1):
    print('URL包含图片文件')
else:
    print('URL不包含图片文件')

if check_url(url2):
    print('URL包含图片文件')
else:
    print('URL不包含图片文件')

上述代码使用正则表达式 \.\w+$ 来匹配URL中的文件类型,然后判断是否包含img文件类型。如果包含img文件类型,则返回True,否则返回False。

如果你只想下载图片文件,可以在代码中添加相应的逻辑来实现。以下是一个示例代码,可以帮助你实现只下载图片的功能:

代码语言:txt
复制
import requests
import re

def download_image(url, save_path):
    response = requests.get(url)
    
    # 获取文件名
    file_name = re.findall(r'/([^/]+)$', url)[0]
    
    # 判断文件类型是否为图片
    file_type = re.findall(r'\.(\w+)$', file_name)[0]
    if file_type.lower() not in ['jpg', 'jpeg', 'png', 'gif']:
        print('文件类型不是图片,无法下载')
        return
    
    # 保存图片
    with open(save_path + file_name, 'wb') as f:
        f.write(response.content)
    
    print('图片下载完成')

# 示例用法
url1 = 'https://example.com/image.jpg'
url2 = 'https://example.com/document.pdf'
save_path = '/path/to/save/'

download_image(url1, save_path)
download_image(url2, save_path)

上述代码使用requests库来发送HTTP请求,并使用正则表达式来判断文件类型是否为图片。如果文件类型是图片,则将其保存到指定的路径中。

请注意,以上代码仅为示例,实际应用中可能需要根据具体需求进行适当的修改和优化。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

没有搜到相关的沙龙

领券