前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Python之Phantomjs无界面浏览器

Python之Phantomjs无界面浏览器

作者头像
鱼找水需要时间
发布于 2023-02-16 10:33:32
发布于 2023-02-16 10:33:32
54200
代码可运行
举报
文章被收录于专栏:SpringBoot教程SpringBoot教程
运行总次数:0
代码可运行

什么是Phantomjs?

  1. 是一个无界面的浏览器
  2. 支持页面元素查找,js的执行等
  3. 由于不进行css和gui渲染,运行效率要比真实的浏览器要快很多

如何使用

  1. 获取PhantomJS.exe文件路径path
  2. browser = webdriver.PhantomJS(path)
  3. browser.get(url)

扩展: 保存屏幕快照:browser.save_screenshot('baidu.png')

示例:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
from selenium import webdriver

# 主要是引入这里和Selenium不一样,其他都一样
path = 'phantomjs.exe'

browser = webdriver.PhantomJS(path)

# 打开网站
url = 'https://www.baidu.com'
browser.get(url)
# 抓图
browser.save_screenshot('baidu.png')

import time
time.sleep(2)

# 百度搜索框输入PhantomJS
input = browser.find_element_by_id('kw')
input.send_keys('PhantomJS')

time.sleep(3)
# 抓图
browser.save_screenshot('PhantomJS.png')

注意:Phantomjs已停止开发。请移步

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2022-07-02,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
selenium用法详解
selenium 是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7, 8, 9, 10, 11),Mozilla Firefox,Safari,Google Chrome,Opera等。这个工具的主要功能包括:测试与浏览器的兼容性——测试你的应用程序看是否能够很好得工作在不同浏览器和操作系统之上。测试系统功能——创建回归测试检验软件功能和用户需求。支持自动录制动作和自动生成 .Net、Java、Perl等不同语言的测试脚本。
顾翔
2019/12/11
1K0
selenium用法详解
2万字带你了解Selenium全攻略
今天带大家一起学(复)习模拟浏览器运行的库Selenium,它是一个用于Web应用程序测试的工具。Selenium测试直接运行在浏览器中,就像真正的用户在操作一样。支持的浏览器包括IE(7, 8, 9, 10, 11),Mozilla Firefox,Safari,Google Chrome,Opera和Edge等。
可以叫我才哥
2021/12/28
3.2K0
2万字带你了解Selenium全攻略
[Python从零到壹] 九.网络爬虫之Selenium基础技术万字详解(定位元素、常用方法、鼠标操作)
Selenium是一款用于测试Web应用程序的经典工具,它直接运行在浏览器中,仿佛真正的用户在操作浏览器一样,主要用于网站自动化测试、网站模拟登陆、自动操作键盘和鼠标、测试浏览器兼容性、测试网站功能等,同时也可以用来制作简易的网络爬虫。
Eastmount
2021/12/02
5.1K0
[Python从零到壹] 九.网络爬虫之Selenium基础技术万字详解(定位元素、常用方法、鼠标操作)
python+selenium实现Web自动化
最近问我自动化的人确实有点多,个人突发奇想:想从0开始讲解python+selenium实现Web自动化测试,请关注博客持续更新!
conanma
2021/09/07
3.6K0
08 Python爬虫之selenium
当获取一个网站的图片数据时,只能爬取到图片的名称,并不能获得链接,而且也不能获得xpath表达式。这是应用了图片懒加载技术。
py3study
2020/01/15
1.1K0
Python爬虫(二十一)_Selenium与PhantomJS
本章将介绍使用Selenium和PhantomJS两种工具用来加载动态数据,更多内容请参考:Python学习指南 Selenium Selenium是一个Web的自动化测试工具,最初是为网站自动化测试而开发的,最初是为网站自动化测试而开发的,类型像我们玩游戏用的按键精灵,可以按指定的命令自动化操作,不同是Selenium可以直接运行在浏览器上,它支持所有主流的浏览器(包括PhantomJS这些无界面的浏览器)。 Selenium可以根据我们的指令,让浏览器自动加载页面,获取需要的页面,甚至页面截屏,或
用户1174963
2018/01/17
2.7K0
Python爬虫(二十一)_Selenium与PhantomJS
2018年python3与selenium教程第1节selenium 初体验声明浏览器访问页面查找节点多节点查找节点交互
通过pycharm,进入browser.find_element_by_id源码,可看到还有多种方式能获取节点
章鱼喵
2018/09/26
8940
2018年python3与selenium教程第1节selenium 初体验声明浏览器访问页面查找节点多节点查找节点交互
74 - selenium与Web页面交互
如果通过selenium控制Web页面,并模拟单继按钮的动作 更多爬虫学习案例可查看我的 “Python爬虫”专栏 ''' selenium ''' from selenium import webdriver import time browser = webdriver.Chrome() # 最大化窗口 browser.maximize_window() try: browser.get('https://www.baidu.com') # 保存页面截图 browser.sa
ruochen
2021/06/13
3890
74 - selenium与Web页面交互
谷歌浏览器Chrome与ChromeDriver版本不一致问题全解
在学习使用selenium模块爬取动态渲染信息时,selenium模块需要通过浏览器驱动来控制浏览器的操作。
数据STUDIO
2021/06/24
4.5K0
【爬虫】使用Selenium爬取升学e网通网站的近几年大学录取情况
高考出分后,填志愿前,以为官方的今年的招生计划只在填报志愿时候才出,想着爬下来。当然,那个时候python还没怎么学呢,怎么会爬?(笑) 最近浅得python爬虫,突然就想起来这个没有完成的事情了。
Livinfly
2022/10/26
5620
【爬虫】使用Selenium爬取升学e网通网站的近几年大学录取情况
网络爬虫 | selenium 爬取动态加载信息
使用selenium实现动态渲染页面的爬取。selenium是浏览器自动测试框架,模拟浏览器,驱动浏览器执行特定的动作,并可获取浏览器当前呈现的页面的源代码,可见即可爬。该工具支持IE浏览器、Mozilla Firefox及Google Chrome等。
数据STUDIO
2021/06/24
1.2K0
爬虫杀手锏-PhantomJS(附案列网站模拟登录豆瓣网)
Selenium: 可以根据我们的指令,让浏览器自动加载页面,获取需要的数据,甚至页面截屏,或者判断网站上某些动作是否发生。Selenium 自己不带浏览器,不支持浏览器的功能,它需要与第三方浏览器结合在一起才能使用。但是我们有时候需要让它内嵌在代码中运行,所以我们可以用一个叫 PhantomJS 的工具代替真实的浏览器。
一墨编程学习
2018/12/14
1.4K0
深入selenium模块基础操作
selenium模块的基本操作 一.模拟浏览器 ​ 谷歌、Firefox、Safari等浏览器 browser=webdriver.Chrome() browser=webdriver.Firefox() browser=webdriver.Safari() browser=webdriver.Edge() browser=webdriver.PhantomJS() 二.访问 上面模拟后的浏览器 browser.get('url') 三.定位网页元素 定位元素的方法: driver.find_element
小小咸鱼YwY
2019/09/11
7410
16、web爬虫讲解2—PhantomJS虚拟浏览器+selenium模块操作PhantomJS
phantomjs 是一个基于js的webkit内核无头浏览器 也就是没有显示界面的浏览器,利用这个软件,可以获取到网址js加载的任何信息,也就是可以获取浏览器异步加载的信息
天降攻城狮
2019/07/13
1.2K0
16、web爬虫讲解2—PhantomJS虚拟浏览器+selenium模块操作PhantomJS
爬虫最终杀手锏 — PhantomJS 详解(附案例)
Selenium: 可以根据我们的指令,让浏览器自动加载页面,获取需要的数据,甚至页面截屏,或者判断网站上某些动作是否发生。Selenium 自己不带浏览器,不支持浏览器的功能,它需要与第三方浏览器结合在一起才能使用。但是我们有时候需要让它内嵌在代码中运行,所以我们可以用一个叫 Phantomjs 的工具代替真实的浏览器。
全栈程序员站长
2022/09/06
2.3K0
Python教程:selenium模块用法教程
selenium最初是一个自动化测试工具,而爬虫中使用它主要是为了解决requests无法直接执行JavaScript代码的问题
Python学习者
2023/02/07
1.9K0
orbital angular momentum_omnidirectional
Scrapy和BeautifulSoup获取的页面大多数都是静态页面,即不需要用户登录即可获取数据,然而许多网站是需要用户登录操作的,诚然,Scrapy和BeautifulSoup可以完成用户登录等操作,但相对的工作量会大了很多,这里我们可以使用Mechanize模块,Mechanize是python的一个模块,用于模仿浏览器操作,包括操作账号密码登录等
全栈程序员站长
2022/11/17
1.1K0
orbital angular momentum_omnidirectional
利用selenium爬取数据总结
selenium的介绍 知识点: 了解 selenium的工作原理 了解 selenium以及chromedriver的安装 掌握 标签对象click点击以及send_keys输入 ---- 1. selenium运行效果展示 Selenium是一个Web的自动化测试工具,最初是为网站自动化测试而开发的,Selenium 可以直接调用浏览器,它支持所有主流的浏览器(包括PhantomJS这些无界面的浏览器),可以接收指令,让浏览器自动加载页面,获取需要的数据,甚至页面截屏等。我们可以使用selenium
北山啦
2022/11/27
1.3K0
利用 Python + Selenium 实现对页面的指定元素截图(可截长图元素)
WebDriver.Chrome自带的方法只能对当前窗口截屏,且不能指定特定元素。若是需要截取特定元素或是窗口超过了一屏,就只能另辟蹊径了。
周小董
2019/03/25
10.9K2
selenium设置proxy、headers(phantomjs、Chrome、Firefox)
文章参考:https://www.zhihu.com/question/35547395
周小董
2019/03/25
4.7K0
推荐阅读
相关推荐
selenium用法详解
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验