前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >使用 Python 刷 csdn 访问量

使用 Python 刷 csdn 访问量

作者头像
Cell
发布2022-02-25 17:30:30
9870
发布2022-02-25 17:30:30
举报
文章被收录于专栏:Cell的前端专栏

使用 python 模拟浏览器行为刷 csdn 访问量,脚本仅做学习,请勿滥用~

直接丢代码,把代码挂到服务器上可以策马奔腾~,也可以生成二进制文件放到 Windows 桌面上随时使用~

打包 exe 参考

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68

#!/usr/bin/python # -*- coding: utf-8 -*- __author__ = 'lruihao.cn' import urllib.request import re import time from bs4 import BeautifulSoup opener = urllib.request.build_opener() opener.addheaders = ('User-agent', 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/38.0.2125.122 UBrowser/4.0.3214.0 Safari/537.36') def get_article_url(page,name): endurl = "/"+name+"/article/details/........" print(name) p = re.compile(endurl) url = "http://blog.csdn.net/"+name+"/article/list/"+str(page) # 使用 build_opener() 是为了让 python 程序模仿浏览器进行访问 html = opener.open(url).read().decode('utf-8') allfinds = p.findall(html) return allfinds #print('allfinds',allfinds) def start_do(allfinds): urlBase = "http://blog.csdn.net" # 需要将网址合并的部分 # 页面中的网址有重复的,需要使用 set 进行去重复 mypages = list(set(allfinds)) for i in range(len(mypages)): mypagesi = urlBase + mypagesi print('要刷的网页有:') for index, page in enumerate(mypages): print(str(index), page) # 设置每个网页要刷的次数 brushNum = 1 # 所有的页面都刷 print('下面开始刷了哦:') for index, page in enumerate(mypages): for j in range(brushNum): try: pageContent = opener.open(page).read().decode('utf-8') # 使用 BeautifulSoup 解析每篇博客的标题 soup = BeautifulSoup(pageContent) blogTitle = str(soup.title.string) blogTitle = blogTitle0:blogTitle.find('-') print(str(j), blogTitle) except urllib.error.HTTPError: print('urllib.error.HTTPError') time.sleep(3) # 出现错误,停几秒先 except urllib.error.URLError: print('urllib.error.URLError') time.sleep(3) # 出现错误,停几秒先 time.sleep(0.5) # 正常停顿,以免服务器拒绝访问 def main(name): for page in range(1,5): print("************第"+str(page)+"页*************") endurl = get_article_url(page,name) start_do(endurl) if __name__ == '__main__': name = input("输入你的 csdn 用户名:") if name=="": name = "qq_39520417" #cheung99857 while 1: main(name) print("开始休息 ...") time.sleep(40)

主函数也可以这样写实现同时刷多人的访问量,人多可以适当减少休眠时间,当然有兴趣的可以尝试一下多线程~

1 2 3 4 5 6 7 8 9

if __name__ == '__main__': # 多用户 names = "qq_39520417","cheung99857" while 1: for name in names: main(name) print("开始休息 ...") # 控制休眠时间相当于控制刷新的速度 time.sleep(30)

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2020-03-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
云服务器
云服务器(Cloud Virtual Machine,CVM)提供安全可靠的弹性计算服务。 您可以实时扩展或缩减计算资源,适应变化的业务需求,并只需按实际使用的资源计费。使用 CVM 可以极大降低您的软硬件采购成本,简化 IT 运维工作。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档