首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

不会玩阴阳师的我带你一键下载《阴阳师:百闻牌》所有卡牌并调用百度OCR识别文字信息

https://ssr.163.com/cardmaker/#/,让我帮他看看怎么能获取到网页中所有的图片链接。...我打开链接一看,页面的标题是阴阳师:百闻牌,下面有选择栏,再下边就是各种奇奇怪怪的看不懂的图片,我就问他这是什么呀?他说是一个游戏阴阳师里边的卡牌。...代码如下: import time from selenium import webdriver from selenium.webdriver import ActionChains from selenium.webdriver.common.keys...,我可以使用请求到的链接来下载图片,再将其中的文字识别出来。...2.环境配置 这个小项目不需要太多的配置,只需要安装两个Python库: selenium 使用pip install selenium命令安装,同时需要下载webdriver驱动,可以点击https

1.4K20

selenium-java自动化教程

Selenium  Selenium是一个自动化测试工具,可以模拟用户操作web端浏览器的行为,包括点击、输入、选择等。也可以获取交互界面上的指定元素的内的数据,也就是爬虫。...支持语言   Selenium支持Java、Python、CSharp、Ruby、JavaScript、Kotlin,对于会java语言的,可以直接使用selenium-java WebDriver  ...Selenium 的核心是 WebDriver,这是一个编写指令集的接口,可以在许多浏览器运行。...我们要在浏览器中模拟用户点击就需要一个对应的驱动组件来实现这个功能,WebDriver就是以原生的方式驱动浏览器,就像用户在本地操作浏览器一样。...Chrome浏览器 chromedriver chromedriver125.0.6422.141稳定版 我使用的浏览器版本是125.0.6422.142,小版本差别影响不大 可以直接使用,下载的

17310
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    【自动化实战】(二)重塑抖音个性化推荐!自动化清空关注列表 | 技术创作特训营第一期

    背景这个自动化脚本的背景大概就是,有一位粉丝对于抖音现在推荐给他的视频不太满意,因此他想清空一下关注列表,以此来重塑一下他抖音的个性化推荐算法,因此,用了 Selenium IDE 完成了这次的需求。...实现首先,需要来到个人主页,点击 “我的”,然后再点击关注,就会弹出关注列表:图片转换成 Selenium IDE 指令则需要两个步骤即可:1、由于 https://www.douyin.com/user...showTab=like 能够直接到达个人主页的 “我的”,因此直接使用 open 指令:CommandTargetopenhttps://www.douyin.com/user/self?...(1) > .TxoC9G6_Selenium IDE 指令界面:图片接下来就是取关操作,只要点击红框中的按钮即可:图片因此转换成 Selenium IDE 指令只需要一个步骤:CommandTargetclickcss...以下是循环执行了一次的运行结果:图片转换成 Python 代码如下所示:from selenium import webdriverfrom selenium.webdriver.common.by import

    51200

    携程,去哪儿评论,攻略爬取

    一开始想直接通过分别发送请求再使用BeautifulSoup进行分析,但发现单纯通过发送请求获取HTML的方法行不通,因为有时候发送请求返回的是一段js代码,而最终的html代码是需要通过执行js代码获得...因此针对此采用selenium模拟实际浏览器点击浏览的动作,等待网页完全显示后再去获取HTML代码进行解析。...如果需要翻页的话也可通过selenium进行翻页按钮点击。...1.携程网 由于景点评论是分页的(一页显示10条评论),而要获取下一页必须得点击页面中下一页按钮,因此通过selenium模拟点击下一页,使下一页评论显示出来,接着再次使用BS解析获取评论…往返循环,直到所有页的评论都获取出来...对景点信息(评分,图片url等)的获取代码已注释。

    1.7K10

    Python爬虫源码,Behance 作品图片及内容 selenium 采集爬虫

    前面有分享过requests采集Behance 作品信息的爬虫,这篇带来另一个版本供参考,使用的是无头浏览器 selenium 采集,主要的不同方式是使用 selenium 驱动浏览器获取到页面源码,后面获取信息的话与前篇一致...Python爬虫源码,Behance 作品图片及内容采集爬虫附工具脚本!...【淘宝】python的淘宝秒杀抢购下单源码参考 百度快排探究(一),Python selenium 实现自然搜索访问目标网站 附上几个关键点,供参考。...selenium 配置 由于 selenium 需要驱动浏览器,webdriver 版本号一定要对应,一是对应浏览器,二是对应浏览器版本,这里本渣渣用的是谷歌 chromedriver.exe 。...document.documentElement.scrollTop={i*500}" browser.execute_script(js) time.sleep(i) # #滑到底部

    33350

    实操 | 从0到1教你用Python来爬取整站天气网

    三、项目分析 爬取天气网城市的信息 url : https://www.aqistudy.cn/historydata/ ? 爬取主要的信息: 热门城市每一天的空气质量信息 ?...点击月份还有爬取每天的空气质量信息 ? 四、新建项目 新建文件夹命令为天气网爬虫 cd到根目录,打开cmd,运行scrapy startproject weather_spider ?...通过follow方法拼接url,meta来传递city_name要保存的城市名字,selenium:True先不管 然后通过callback方法来调度将下一个爬取的URL,即就是天的爬取详细页 weather.py...说明了是通过js生成的数据,scrapy只能爬静态的信息,所以引出的scrapy对接selenium的知识点,所以上面meta传递的参数就是告诉scrapy使用selenium来爬取。...from selenium import webdriver from selenium.webdriver.chrome.options import Options class WeatherSpiderDownloaderMiddleware

    73830

    爬虫入门经典(十五) | 邪恶想法之爬取百度妹子图

    二、保存内容成html 2.1 通过selenium模拟普通人查找百度图片 1. 普通人搜索图片 ?...已知,正常人打开百度导航搜索图片的正确方式应该是这样的:百度导航—>输入关键词—》点击查找—》点击所有图片 ? 2 分析 ?...知道了普通人如何查找图片,那么我们下面就通过selenium模拟上述的具体过程。在模拟之前,我们先分析一下几个主要的点。 ? 1....查询点击 ? ? 3. 点击关于美女的百度图片 ? ? 3 代码实现 # 控制chrome浏览器 driver = webdriver.Chrome("....如果实在要白嫖的话,那祝你开心每一天,欢迎常来我博客看看。   码字不易,大家的支持就是我坚持下去的动力。点赞后不要忘了关注我哦! ? ?

    88920

    如何用 AI 问答 API 彻底改变用户体验!

    inviter_id=aef91f35-f7f9-494d-bcf6-3a533440101f) 对应页面申请对应的服务,(文章底部原文链接可进入官网) 进入页面之后,点击「Acquire」按钮,如图所示...另外如果想生成对应的对接代码,可以直接复制生成,例如 CURL 的代码如下: curl -X POST 'https://api.acedata.cloud/aichat/conversations'...图片识别 本 AI 也能支持添加附件进行图片识别,通过 references 传递对应图片链接即可,比如我这里有一张苹果的图片,如图所示: 该图片的链接是 https://cdn.acedata.cloud...}' 运行结果如下: { "answer": "The weather in New York today is as follows:\n- Current Temperature: 16°C...\nFor more details, you can visit [The Weather Channel](https://weather.com/weather/tenday/l/96f2f84af9a5f5d452eb0574d4e4d8a840c71b05e22264ebdc0056433a642c84

    16910

    selenium-java web自动化测试工具

    本篇文章由来,这两天整理了下自己经常使用而且很熟练的项目,今天突然想起漏了一个,补上了,但想到还没对应的博客,那就写一个简单的 我经常使用且相对熟练的部分技术如下(不知道算不算各位大神眼中的辣鸡): ?...公司自己的产品,且需要经常回归测试,比如类似OA这类业务系统产品 不适合的呢:比如外包业务,快速交付后就不管的,只需要测试一两次 案例一:一个简单示例(无弹出框这类单一页面),先看看执行效果(点击图片查看高清版本...-- https://mvnrepository.com/artifact/org.seleniumhq.selenium/selenium-java --> ...(0, 1600)"); 91 Thread.sleep(1000); 92 //移动到指定元素,且元素底部和窗口底部对齐 参考 https://www.cnblogs.com...18行火狐浏览器的驱动下载地址:https://github.com/mozilla/geckodriver/releases   然后运行,你就可以为所欲为了  案列二:有弹出框及使用了Frame的页面

    2.8K20

    Python3网络爬虫(九):使用Selenium爬取百度文库word文章

    我想,看到这样的一个文章,如果爬取当前页面的内容还是很好爬的吧。感觉so easy!至少我当时是这么想的,但是当把文章翻到最下方的时候,我看到了如下内容: ?     ...呃….需要点击“继续阅读”才能显示后续的内容,我单爬这一页内容,是爬不到后续的内容的。第一个想到的方法是,抓包分析下,然后我又一次蒙逼了: ?     Request URL这么长!!...带着这个思考,Selenium神器走入了我的视线。 3 预备知识 3.1 Selenium 3.1.1 简介     Selenium 是什么?一句话,自动化测试工具。...但是有一点需要注意,就是在点击的时候,元素不能有遮挡。什么意思?就是说我在点击这个按键之前,窗口最好移动到那里,因为如果这个按键被其他元素遮挡,click()就触发异常。...的User-Agent打开浏览器,画风是这样的(第二条新闻的图片略劲爆): ?

    3.4K61

    Python爬虫 selenium自动化 利用搜狗搜索爬取微信公众号文章信息

    ——刘同 文章目录 一、需求和网页分析 二、selenium爬虫 一、需求和网页分析 URL:https://weixin.sogou.com/ 你是否有特别喜欢的一些公众号文章,比如说关于网易云热评的...我那么多遗憾,那么多期盼,你知道吗 下面以在搜狗里搜索 网易云热评墙 为例,爬取得到的全部文章信息(包括标题、日期、链接),并保存到Excel,使用Selenium来实现。...二、selenium爬虫 selenium是一个用于web应用程序自动化测试的工具,直接运行在浏览器当中,可以通过代码控制与页面上元素进行交互,并获取对应的信息。...代码如下: from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.support...模块根据时间差求出具体时间 # 然后格式化为 2020-8-31 这样的格式 if '前' in date: today = datetime.datetime.today

    3.2K30

    你的车票,我来负责!!!

    第一次写爬虫,咱从入门级——12306车票爬取 开始 我们要爬取的信息是https://www.12306.cn/index/上的车票信息 当我们选择出发地和目的地,点击查询可以获得相关的车票信息,我们现在要将这些信息使用...获取站点名与简称的字典 下面就开始写代码了,首先有几个库是需要装的,要是没装,可以先安装一下 python -m pip install prettytable,selenium,requests stations.py...,要是我还没写就百度找一下 chrome_options = webdriver.ChromeOptions() chrome_options.add_argument('--headless...browser.quit()#退出后台的浏览器,不退出会占内存的 #构建链接 request_url = 'https://kyfw.12306.cn/otn/leftTicket...tickets.py from stations import stations from prettytable import PrettyTable from selenium import webdriver

    74810

    Selenium自动化防爬技巧:从入门到精通,保障爬虫稳定运行,通过多种方式和add_argument参数设置来达到破解防爬的目的

    设置合理的窗口大小可以使请求更加自然。 3. 禁用图片加载 加载图片会增加请求次数和响应时间,同时也可能暴露自动化脚本的特征。禁用图片加载可以加快请求速度并减少被识别的风险。 4....模拟用户行为(示例:模拟点击) from selenium.webdriver.common.by import By from selenium.webdriver.common.keys import...显式等待通过WebDriverWait类和一系列预定义的等待条件(如元素可见性、可点击性等)来实现。...四、结尾 通过这篇文章给大家分享我在学习过程中的一些经验和心得,希望能够对大家有所帮助,同时也接受大家的建议和意见,共同进步、共同学习。...如果你觉得我的文章对你有所帮助,我诚挚地邀请你关注、点赞和分享。

    22710

    爬虫 | selenium之爬取网易云音乐歌曲评论

    如果我们想利用网站的 REST API 来爬取数据,就必须知道其使用的加密方式。破解过程需要抓包,阅读并分析网站的 js 代码。这整个过程可能会花费一天甚至更长的时间。...selenium 通过 Webdriver 来操作浏览器。因为我们使用的浏览器是 Chrome,所以需要下载 Chrome 浏览器对应的驱动。...点击查看大图 MongoDB 网易云音乐的评论数据总数都很大,十几万条数据比比皆是,甚至还有上百万条数据。所以需要将数据存储到数据库中,我选用的是 MongoDB。...3)爬取第一页面的评论的数据,然后存储到数据库中。 4)利用 Selenium 模拟点击下一页按钮,再继续爬取该页面的评论数据,并存储到数据库中。 5)一直循环点击,直到所有分页的数据都被爬取完成。...3 爬取结果 评论总数大概有 23W 条, 我又在代码中增加延时操作。所以爬取所有评论大概需要 69 个小时。目前我只跑了 9 个小时,我贴下暂时爬取的结果。 ?

    2K22
    领券