Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >手把手使用Python教你破解谷歌(Google)人机验证码—上篇

手把手使用Python教你破解谷歌(Google)人机验证码—上篇

作者头像
Python进阶者
发布于 2020-02-19 07:02:55
发布于 2020-02-19 07:02:55
7K1
举报

众里寻他千百度。蓦然回首,那人却在,灯火阑珊处。

/1 前言/

今天呢,咱们来说一下Google,我们都知道,Google是目前地表最强的搜索引擎了,我们可以借助Google庞大的搜索资源找到一些自己想要的资源,可能是一些收费电影,可能是一些奇门小说,可能是某个角落的种子,不管怎么说,Google搜索还是挺给力的,但是呢,有的我们可能都遇到过,我们搜索的多了,会有下图的这种情况。

这种验证码呢,叫做ReCaptcha验证码,相对来说,是比较繁琐的验证码之一。

  当然了,ReCaptcha不止谷歌一家在用,国外的网站很多都是使用这种验证码,但是在国内不多,因为在国内比较容易被墙,所以用的少。但是我们是高端玩家,在自由的Internet中,我们怎么可能只局限于国内,下面,我们就针对ReCaptcha验证码进行破解。

/2 测试网站预览/

  测试网站:https://www.google.com/recaptcha/api2/demo

  谷歌提供的范例,实际网站验证码和这个一模一样。

ReCaptcha验证码样式,如下图所示。

/3 为什么使用第三方平台/

今天呢,咱们来说一下Google,我们都知道,Google是目前地表最强的搜索引擎了。老读者们可能知道,年前的时候我用第三方服务破解了B站的登录,没有来得及上车的小伙伴可以戳这两篇文章:干货|Python大佬手把手带你破解哔哩哔哩网滑动验证(上篇)干货|Python大佬手把手带你破解哔哩哔哩网滑动验证(下篇)。但是经常逛B站的小伙伴们肯定都知道B站目前已经更改了登录方式,想了解之前B站自动登录的小伙伴可以戳这里:Python奇淫技巧之自动登录哔哩哔哩,所以我那篇文章真是赶上了末班车,但是然并卵,现在肯定是登录不了了。后期有时间,给大家整理一篇关于B站破解的新文章学习一下。

嗯,看到这可能有人会对我不屑一顾,说辣鸡才会用第三方平台,要是按照技术来划分的话,我是真的辣鸡,哈哈~~

  但是这里要抬杠一下,并不是说用第三方平台就是辣鸡,我们可以想象一下,如果是滑动验证码,我们当然有一试的能力,python可以调用OpenCV,看看文档,当然是可以实现了。但是有个问题是,你可能针对的一个网站的滑动验证识别好了,但是在每个网站的滑动验证码都不太一样的情况下,在用OpenCV识别的时候,可能就会出现识别率低的情况。要是在公司,一直完不成任务,嗯,,,等着被炒鱿鱼吧,再说,像谷歌人机个人也解决不了,没有NB的机器学习是不可能的,所以只能用第三方平台,毕竟,完成任务才是首要任务。

  话不多说,这里选用的第三方平台:https://2captcha.com/。

/4 为什么使用第三方平台/

我们先来了解一下现在打码平台机制大概都有哪些,不是很全面,但是可以参考一下。

  第一种呢:就是打码平台训练好各种各样的数据,比如,哪些是花,哪些是车,然后我们把图片发送给打码平台,他给我们结果,但是这样会有个问题,如果训练的不好,我们这边的结果也是很不好的,各种不准确,影响效果

  第二种:就是平台雇人,我们把整个验证码都给打码平台,平台找人帮助我们点击,然后把结果给我们,我们在登录了或者做其他

  我们可以看出来,肯定是第二种更加灵活的,现在阶段,机器再NB,至少 在验证码上准确率还是不如我们人类这么机智的。

  2captcha平台目前采用的就是第二种方式,赚取的是中间差价,但是识别率是我用过最高的,曾经因为选错了平台,一直不成功,加班加点,鼠标都被我砸坏了,唉,所以,选择一个合适的平台还是很重要的

/5 所需工具/

Chromedriver:浏览器驱动,可以理解为一个没有界面的chrome浏览器。

Selenium:用于模拟人对浏览器进行点击、输出、拖拽等操作,就相当于是个人在使用浏览器,也常常用来应付反爬虫措施。

/6 总结/

写到这里,文章字数已经将近2000字了,介于篇幅原因,这篇文章主要介绍了第三方打码平台和破解的理论部分,下一篇文章将详细介绍破解谷歌人机的具体过程,下篇文章会配上较多的图和代码,明天早上9点不见不散,小伙伴们敬请期待吧!

------------------- End -------------------

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-02-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Python爬虫与数据挖掘 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
1 条评论
热度
最新
救命!想看下篇!!!
救命!想看下篇!!!
回复回复点赞举报
推荐阅读
编辑精选文章
换一批
干货|Python大佬手把手带你破解哔哩哔哩网滑动验证(上篇)
有爬虫经验的各位小伙伴都知道,正常我们需要登录才能获取信息的网站,是比较难爬的。原因就是在于,现在各大网站为了反爬,与爬虫机制斗智斗勇,一般的都加入了图片验证码、滑动验证码之类的干扰,让我们的爬虫半途折返。
Python进阶者
2020/01/13
1.1K0
干货|Python大佬手把手带你破解哔哩哔哩网滑动验证(上篇)
国内使用Google reCaptcha验证码
为啥我出这篇文章呢,因为我有几天用了vaptcha进行人机验证,还算好用,但是发现手机上有广告,本着原则问题,我剔除了人机验证。 又发现在邻居@kidultff发现谷歌国内验证也可以,于是探路V3版本
一朵灼灼华
2022/08/05
4.5K0
国内使用Google reCaptcha验证码
破解验证码
思路就是:爬取网页,获取图片,将图片加载到本地,然后再用第三方识别出来,马上开干。
y191024
2022/09/20
1.5K0
破解验证码
验证码破解全流程实战
验证码,全称为“Completely Automated Public Turing test to tell Computers and Humans Apart”,即全自动区分计算机和人类的图灵测试,Captcha。早在上个世纪90年代,为了防止恶意的网络机器人行为,像邮件轰炸、暴力破解密码等,验证码应运而生。
TechLead
2023/10/21
2.4K0
验证码破解全流程实战
谷歌家的验证码怎么了?搞他!
很久没有做爬虫破解类相关的分享了,之前交流群里有朋友提问谷歌系的reCAPTCHA V2 验证码怎么破,因为工作的原因我是很久之后才看到的,也不知道那位朋友后来成功了没有。那今天就来跟大家分享一下 reCAPTCHA V2 的破解。
崔庆才
2020/01/02
4.5K0
Python奇淫技巧之自动登录哔哩哔哩
嘿,各位小伙伴晚上好呀,今天要带来点什么干货呢,就从我的实际开发中来给大家带来一个案例吧,如何自动登录哔哩哔哩。
Python进阶者
2020/01/14
2.1K0
Python奇淫技巧之自动登录哔哩哔哩
国内使用reCaptcha验证码的完整教程
reCaptcha是Google公司的验证码服务,方便快捷,改变了传统验证码需要输入n位失真字符的特点。reCaptcha在使用的时候是这样的:
宜轩
2022/12/26
36.7K0
国内使用reCaptcha验证码的完整教程
常用验证码之滑动验证码|图形验证码
这里是常用验证码的第三篇——滑动/图形验证码。在前两篇已经实现了随机验证码和算术验证码,感兴趣的可以去看一下~
流眸
2020/07/06
22.5K1
验证码破解没有训练集?我教你生成一万个!
对于验证码破解,我在去年写过一篇文章我深度学习0基础,还训练出一个识别验证码模型!,并且把代码放在GitHub上,GitHub地址大家就直接访问前面那篇文章就知道了。最近有些GitHub上过来的小伙伴问我各种各样的问题,其中有一个就是如何生成训练所需要的数据集,这里也就是指验证码。
Python进击者
2020/05/08
1.1K0
验证码破解没有训练集?我教你生成一万个!
不得不说这个验证码生成库,牛逼了!
这篇文章讲的是Java中一个生成验证码的第三方库kaptcha。其实这个库在网上的资料也比较多,但是我看了下,都是结合在web开发当中的,可能有些小伙伴只需要生成验证码并保存成图片格式,所以这篇文章的主要目的也就是通过这个库来生成我们的验证码数据集。
Python进击者
2020/05/08
2.7K0
Selenium+2Captcha 自动化+验证码识别实战
本文深入探讨了使用Selenium库进行网页自动化操作,并结合2Captcha服务实现ReCAPTCHA验证码的破解。内容涵盖Selenium的基础知识、验证码的分类、2Captcha服务的使用,以及通过实例进行的详细讲解,最后对实践进行总结和优化思考,为读者提供了一条完整的验证码破解实践路线图。
TechLead
2023/10/21
2K0
Selenium+2Captcha 自动化+验证码识别实战
2025最新滑块验证码、图形验证码、解决滑块验证码识别的技术方法大全
滑块验证码(Slider Captcha)自上线以来,以其交互性强、用户体验较好而被广泛应用于各类网站和 APP 的登录、注册、支付等关键环节。相比传统文字验证码或图形混淆验证码,滑块验证码能够更有效地区分真人与机器人,降低恶意脚本的通过率。然而,随着技术的发展,滑块验证码也不断被识别与破解。本文将从「生成与验证组件」和「识别与破解工具」两个大类入手,结合多款 GitHub 开源项目,逐一介绍各自的技术栈、实现原理、优缺点,以及实际使用场景与配置要点,并在最后给出综合对比与推荐,帮助技术选型和快速上手。
猫头虎
2025/06/08
1.1K0
Python | 用机器学习搞定数字验证码,还有谁?!
来源:http://www.hi-roy.com/2017/09/19/Python验证码识别
用户1634449
2018/12/18
2.1K0
原来这样 4 步就能破解,再也不用手输验证码了!
• 目标网站开放凭据(验证码的“站点密钥”,站点url,可选:代理IP)由您(客户端)复制并提交给2captcha服务。您可以使用简单的Web开发人员工具找到它们。
double
2020/04/01
4.1K0
验证码的处理 google recaptcha
google验证码的第三方处理 #经过批量测试,成功率高达百分之九十,1000个邮箱大概4美金,比较实惠 第一部分. 通过请求youtube简介页面,获取网红的channel_id和页面产生的ses
用户8346838
2021/03/10
1.5K0
手把手丨输验证码输到崩溃?教你15分钟黑掉全球最流行的验证码插件
大数据文摘作品 编译:Katrine Ren、朝夕、钱天培 验证码这种东西真的是反人类。虽然它在保证账号安全、反作弊以及反广告有着至关重要的作用,但对于普通用户来说,输验证码很多时候实在是让人抓狂。 文摘菌18岁的时候帮朋友刷QQ空间留言就天天和验证码作斗争,前几天传一个视频又创下了连续7次输错验证码的记录。不过好在文摘菌最近发现,用机器学习破解简单验证码已经是妥妥的小事了。 今天,文摘菌就带来了一个15分钟黑掉世界上最受欢迎的验证码插件的小教程。欢迎开启新年第一黑。 先给大家介绍一下今天我们要黑的验证码
大数据文摘
2018/05/24
7410
用Python机器学习搞定验证码
写爬虫有一个绕不过去的问题就是验证码,现在验证码分类大概有4种: 图像类 滑动类 点击类 语音类 今天先来看看图像类,这类验证码大多是数字、字母的组合,国内也有使用汉字的。在这个基础上增加噪点、干扰线、变形、重叠、不同字体颜色等方法来增加识别难度。 相应的,验证码识别大体可以分为下面几个步骤: 灰度处理 增加对比度(可选) 二值化 降噪 倾斜校正分割字符 建立训练库 识别 由于是实验性质的,文中用到的验证码均为程序生成而不是批量下载真实的网站验证码,这样做的好处就是可以有大量的知道明确结果的数据集。 当
小小科
2018/05/02
1.3K0
用Python机器学习搞定验证码
谷歌最新验证系统又双叒被「破解」了,这次是强化学习
对于谷歌浏览器的用户来说,上面这幅画面想必并不陌生。这是谷歌开发的验证码系统 reCaptcha,旨在确认访问者是人还是程序,并防止恶意程序的入侵。
机器之心
2019/04/29
2.5K0
谷歌最新验证系统又双叒被「破解」了,这次是强化学习
怼就完事了,总结几种验证码的解决方案
截止到今天咸鱼已经写了很多期关于 Js 逆向的文章,不过这么多的文章都有一个共同点,都是关于加密参数或者密码加密的解析,很多读者在后台私信希望能够出一些关于滑动验证或者人机验证的分析教程。
咸鱼学Python
2020/01/14
2.9K0
怼就完事了,总结几种验证码的解决方案
Google 验证码进化史:我们越来越方便,但也交出了越来越多的隐私
即使现在互联网已经渗透到我们生活的方方面面,但它依然只是现实的物理世界在虚拟的网络空间上按比特信息编码后的投射。
猿哥
2019/07/15
1.3K0
Google 验证码进化史:我们越来越方便,但也交出了越来越多的隐私
推荐阅读
相关推荐
干货|Python大佬手把手带你破解哔哩哔哩网滑动验证(上篇)
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档