Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >群友:谁帮我下个xx文库的文件 大佬:过来,我给你爬一下

群友:谁帮我下个xx文库的文件 大佬:过来,我给你爬一下

作者头像
Python进击者
发布于 2020-05-08 07:50:12
发布于 2020-05-08 07:50:12
49600
代码可运行
举报
文章被收录于专栏:JAVAandPython君JAVAandPython君
运行总次数:0
代码可运行

前言

这几天在公众号Python交流群里有人问道XX文库怎么免费下载,心想着我也没研究过这个,不知道难不难,于是自己去抓了一下包。其实难度不是很大,只是包的数据比较多不太好找,这里我只提供思路,不会提供代码,大家懂就行,当然如果你还是写不出,可以私聊我进Python交流群。

XX文库分析

PPT

首先我们来分析一下PPT的下载,其实对于这种数据一般都是采用抓包的思路来进行的。

我一个一个找了一下,发现上面的数据包中有我们想要的数据,我们看下拿到了什么数据:

我们看到了有一个参数为20。恰好,我们想要下载的PPT也是20页,于是访问一下zoom中的链接。

正是我们要的,所以后面你懂得,就交给帅气牛逼的你了!

word

随意找了个word文档,同样的思路,我们还是来抓包,当然这个包跟我们之前的肯定不同。

同样查看这个包,看看这个包给了我们什么数据:

可以看到这就是word当中的文字信息,当然有些小伙伴说为啥你这不只是拿到文字信息么?确实这样只能拿到文字信息,但是在这串数据里面有相应的位置坐标信息。帅气牛逼的你们可以自己取折腾折腾!

txt

关于txt就有点小麻烦了,首先我们需要获取该txt文档的id名称

我们可以直接从链接当中获取。

然后我们直接进行url的搜索

搜索关键词,975114ef19e8b8f67c1cb9d9是我的文件id,自己修改

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
wkretype.bdimg.com/retype/text/975114ef19e8b8f67c1cb9d9

我们双击筛选出来的包:

你可能一脸懵逼,但是我们去转换一下字符编码:

可以看到正是我们需要的数据。后面的大家就自己解决啦!

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-04-20,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python进击者 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Java线上故障排查不会怎么办,p8大佬总结的套路清单带你轻松玩转!
线上故障主要会包括 CPU、磁盘、内存以及网络问题,而大多数故障可能会包含不止一个层面的问题,所以进行排查时候尽量四个方面依次排查一遍。同时例如 jstack、jmap 等工具也是不囿于一个方面的问题的,基本上出问题就是 df、free、top 三连,然后依次 jstack、jmap 伺候,具体问题具体分析即可。
Java程序猿
2021/09/14
4630
群邮件钓鱼软件的简单分析并拿到后台
不知道从何时起,qq群邮件就成为了钓鱼软件传播的一个绝佳场所,什么“”萌妹变声器”,“破解UU加速器”。 我偶尔闲的无聊的时候,就会下载下来耗费几分钟逆(ti)向(chuan)一下.发现钓鱼软件总是要把自己服务器的账号密码写到软件里面。 现在我们来一起捋一捋这个事情。
xuing
2019/10/19
1.9K0
群邮件钓鱼软件的简单分析并拿到后台
我如何用最简单的前端技术揭示那些灰色产业背后的原理
这篇文章讲述的一些很通用简单的前端技术,但却是实现某些灰色产业的关键技术,当然我只实现一些很简单的思路和方法,尽量写得简单明了,希望能举一反三,一起探索前端技术的各种无限可能。我在几年前也写过几篇这方
wscats
2020/12/08
4400
看我深夜如何绕过disable_functions拿到主机权限
事情的起因是这样的 昨天晚上还在和女朋友聊天的时候,突然一个好兄弟发了一个连接给我们,说他的朋友被骗了钱,我们拿到主站的时候大概是这样的 :sun_with_face:这种站点一看就知道是那种骗人的站点,也不知为啥有这么多人相信天上掉馅饼。
WgpSec
2021/02/04
2.1K0
看我深夜如何绕过disable_functions拿到主机权限
frida实战笔记
frida 是一个十分强大的工具,已经学习它有一段时间了,但也只是零零碎碎的练习与使用。最近在对一个 APP 进行分析的过程中,使用 frida 完成了脱壳、hook 破解、模拟抓包、协议分析的操作,可以说是一条龙服务了, 感觉十分有意义,学到了很多,对 frida 的理解和掌握程度也提高了不少,记录下来这次实战分享给各位正在学习 frida 的看雪用户。(在看雪上论坛水了这么久,也该反馈些东西了,逃
bosh123
2020/08/27
3.2K0
De1CTF Misc wp
De1CTF这次队里师傅都很出力很牛逼,最后成绩也很不错,俺被直接带飞,这里对MISC做一个汇总wp,部分wp来自于队友。
L1near
2022/11/11
9740
De1CTF Misc wp
记一次C/S架构客户端配置文件泄露导致的内网沦陷
注:由于目标单位所用的web系统以及服务器都是比较老的机子,所以可能没有很高的技术含量,不足之处还望批评指正。
F12sec
2022/09/29
1.7K0
记一次C/S架构客户端配置文件泄露导致的内网沦陷
某管1个月迅速赚钱经验及colly实战爬取美女图片站点源码级细节分享,绝对不容错过golang技能buff加成!
本文总共分为四部分,直接从第二部分开始,嘻嘻。第二部分,主要是讲colly之前的引子,用大名鼎鼎的scrapy做开胃菜,帮你系统了解一下scrapy是如何实现自己的爬虫代理的!正所谓殊途同归,只有举一返三,方能融会贯通!第三部分,我们的主角colly该出场了,把实现它代理的方式通通告诉你,保证你的golang开发功力又会提高一大截!第四部分,牵扯到爬虫,那些必然面对的问题一个跑不了,而最关键的怕就是重复过滤了,于是我把我在colly里使用redis做布隆过滤的方案分享给你,相信你如果有爬虫需求,这也是迟早都用得上的不时之需,顺便也提了下我对colly实现分布式的理解!
用户1413827
2023/12/02
4150
直播后生信入门马拉松答疑合集
试试去官网重新下载校园版 https://www.netsarang.com/en/free-for-home-school/
生信技能树
2022/12/16
6380
直播后生信入门马拉松答疑合集
开发人员系统功能设计常用办公软件分享
大多数开发人员随着经验的增长,会进入一个管理层的岗位(开发小组的组长,当然啦博主才毕业大半年,还不是开发组长,只是提前了解了一下分享给大家),需要负责软件系统的设计(系统功能设计和数据库设计)。然后将你的设计思路传递给其他同事(也是一个讨论并完善的过程),让他们协助编码完成软件的开发。在设计思路的传递时,图文结合表述会更加直观清晰些。
全栈程序员站长
2021/04/07
2K0
手把手教你读取Android版微信和手Q的聊天记录(仅作技术研究学习)
特别说明:本文内容仅用于即时通讯技术研究和学习之用,请勿用于非法用途。如本文内容有不妥之处,请联系JackJiang进行处理!
JackJiang
2018/10/08
4.2K1
程序员坐牢了,继续被安排写代码。。
点击关注公众号,Java干货及时送达 来源:www.zhihu.com/question/483752248/answer/2127520344 今天给大家分享一篇有意思的爽文,但也是根据多年之前一个真实报道改编而来的。本文字数较多,建议先收藏,上下班路上、带薪上厕所、浑水摸鱼时再慢慢看~ 本故事纯属虚构 请大家不要随意模仿,后果自负! —  —  —  —  —  —  —  — 因为删库跑路,我坐牢了。 公司老板经营不善,拖欠工资半年,我终于忍无可忍,提出离职。 而老板居然说:爱走就走,一毛没有。滚吧!
Java技术栈
2022/08/25
1.2K0
程序员坐牢了,继续被安排写代码。。
使用HackRF解调TDD-LTE信号
软件无线电(Software Defined Radio)以前往往以高(zhuang)大(bi)上(fan)的面目示人,是大公司或学校实验室的高级玩具,一套系统动辄几万甚至几十万,从来都是一个2B(2B = to business)的模式。自从一个芬兰黑客(考证癖出来考证一下)破解了rtl2832芯片的电视棒之后(http://sdr.osmocom.org/trac/wiki/rtl-sdr),SDR终于像树莓派一样普及了。你可以淘宝一个50或60RMB的电视棒,然后给妹子show off跟踪飞机,偷听空
FB客服
2018/02/02
6.1K0
hgame-week1-writeup
那必然是直接冲去搭顺风车,url:http://hitchhiker42.0727.site:42420/HitchhikerGuide.php
HomeboyC
2022/09/19
6880
hgame-week1-writeup
兜哥的信安之路
2008 年,我是看着《我的华为十年》这篇文章进入这家公司的,当时我的总监就是这篇文章的作者家俊,文档地址:
信安之路
2018/08/08
9670
unctf2020部分题解
<img src="https://img-blog.csdnimg.cn/img\_convert/8547368f4537fbf56d66e58f9be38745.png" alt="">
ruochen
2021/11/20
1.7K0
干货 | 渗透测试全流程归纳总结
  从旁观者的角度了解整个WEB应用乃至整个目标的全貌,但是资产是收集不完的,可以边收集,边进行一定程度的测试。信息收集最小的粒度应是目录。
HACK学习
2021/03/03
4.5K0
4个核心要点揭开爬虫真面目,小心被反爬!
爬虫与反爬虫,是一个很不阳光的行业。   这里说的不阳光,有两个含义。   第一是,这个行业是隐藏在地下的,一般很少被曝光出来。很多公司对外都不会宣称自己有爬虫团队,甚至隐瞒自己有反爬虫团队的事实。这可能是出于公司战略角度来看的,与技术无关。   第二是,这个行业并不是一个很积极向上的行业。很多人在这个行业摸爬滚打了多年,积攒了大量的经验,但是悲哀的发现,这些经验很难兑换成闪光的简历。面试的时候,因为双方爬虫理念或者反爬虫理念不同,也很可能互不认可,影响自己的求职之路。本来程序员就有“文人相轻
BestSDK
2018/03/01
1.7K0
Ladon捕获0day payload批量getshell
使用2011版菜刀访问某个webshell,发现被WAF拦截,,使用2016版可连,想看一下两者的发包特征,搭个IIS、Apache、Nginx、Tomcat环境来看post数据,默认中间件不显示这些数据,有些人可能压根就不会搭,你本意只是想看个发包,还要浪费时间去搭环境?当然也可以使用WireShark等抓包工具,但是又不会用怎么办?没事使用Ladon一条命令就搞定,非常简单。以前教大家用过Ladon的web模块捕获windows密码、获取无回显RCE漏洞命令回显、架设WEB远程下载payload、测试漏洞等,实际上还有很多用途,比如捕获0day、捕获工具payload等
用户8478399
2022/09/22
1.7K0
Ladon捕获0day payload批量getshell
爬虫入门经典(二十一) | 破解CSS加密之爬取大众点评
在上篇文章中我们已经讲了js加密,这个需要使用者有基本的js阅读和调试能力。但是不一定都解决所有问题,不过可以提供这样的流程和思路。
不温卜火
2020/11/24
2.1K2
爬虫入门经典(二十一) | 破解CSS加密之爬取大众点评
相关推荐
Java线上故障排查不会怎么办,p8大佬总结的套路清单带你轻松玩转!
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验