首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Python使用BeautifulSoup爬取妹子

最近突然发现之前写的妹子的爬虫不能用了,估计是网站又加了新的反爬虫机制,本着追求真理的精神我只好又来爬一遍了! 效果 ? 文件夹 ?...妹子 思路整理 页面地址:http://www.meizitu.com/ 获取首页分类标签地址,传入下一步 ?...贴一段官方解释: Beautiful Soup提供一些简单的、python式的函数来处理导航、搜索、修改分析树等功能。...soup.select('body span a') return channel ##获取分类地址 保存图片 这里需要注意的是保存图片的时候需要加上header,应该是网站更新了验证,去年爬妹子直接保存就可以的...channel_title = (channel.get('title')) print '***开始查找 '+channel_title.encode('utf-8') +' 分类下的妹子

1.4K20
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    「玩转Python」突破封锁继续爬取百万妹子

    前言 从零学 Python 案例,自从提交第一个妹子图版本引来了不少小伙伴的兴趣。最近,很多小伙伴发来私信说,妹子不能爬了!?...趁着周末试了一把,果然爬不动了,爬下来的都是些 0kb 的假图片,然后就是一系列的报错信息,显然妹子长已经做了防御措施。 伪装 无论怎么做防御措施,总不能把正常用户也给禁了?...所以,我们要尽可能的伪装成正常用户,我就是来看妹子的。 防盗链处理 延时处理请求图片 准备尽量多的请求头 动态代理IP(花钱,暂且不考虑) 请求头,越多越好,尽量避免同一个请求头去处理图片。...random.choice(meizi_headers), 'Referer': url} img = requests.get(url, headers=headers) 最后一个动态代理IP,如果长把你...小结 下面是新爬取的妹子,仅限18岁以上少年查看,未成年会自行马赛克处理。 源码:https://gitee.com/52itstyle/Python

    61510

    老司机带你用python来爬取妹子

    这是日常学python的第14篇原创文章 我前几篇文章都是说一些python爬虫库的用法,还没有说怎样利用好这些知识玩一些好玩的东西。那我今天带大家玩好玩又刺激的,嘻嘻!...文章首发于公众号「日常学python」 我们今天要爬的就是他的图集,先看看网站。搜索美女,然后点击图集,可以看到下面这些内容 ? 我们要做的就是把上面的图片给爬下来。 那开始分析网站。...jpg', 'wb') as f: # 把图片写入文件内 f.write(atlas) print('下载完第%d个文章的%d幅完成...这里可以充分体现了人生苦短,我用python的真理。 而且,他还可换关键字继续搜,你想搜什么照片都可以。 下篇文章写个requests库和正则来爬内容的文章,让你们感受下正则的强大!

    1.2K110

    Python爬虫入门教程 2-100 妹子网站爬取

    妹子网站----前言 从今天开始就要撸起袖子,直接写Python爬虫了,学习语言最好的办法就是有目的的进行,所以,接下来我将用10+篇的博客,写爬图片这一件事情。希望可以做好。...妹子网站---- 网络请求模块requests Python中的大量开源的模块使得编码变的特别简单,我们写爬虫第一个要了解的模块就是requests。...妹子网站---- 安装requests 打开终端:使用命令 pip3 install requests 等待安装完毕即可使用 接下来在终端中键入如下命令 # mkdir demo # cd demo...妹子网站---- Python爬虫页面分析 有了上面这个简单的案例,我们接下来的操作就变的简单多了。爬虫是如何进行的呢?...| 妹子',response.text).group(1) all_pic_src = re.findall('<img alt=.*?

    1.6K61
    领券