腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
如
何在
selenium
中
使用
proxy
来
避免
抓取
数据
时
的
IP
限制
?
selenium
、
web-scraping
、
proxy
当我们在
抓取
scrapy
时
使用
用户代理或代理池
时
,对于
selenium
应该
使用
什么工具?并且还想知道如何
使用
。有人能帮我解决这个问题吗?
浏览 30
提问于2020-07-17
得票数 0
回答已采纳
14
回答
在Python中
使用
代理运行
Selenium
Webdriver
python
、
selenium
、
proxy
、
selenium-webdriver
、
selenium-ide
我正在尝试用Python运行
Selenium
Webdriver脚本来执行一些基本任务。当通过
Selenium
IDE接口运行机器人时,我可以让它完美地工作(即:当简单地让GUI重复我
的
操作
时
)。但是,当我将代码导出为Python脚本并尝试从命令行执行它
时
,Firefox浏览器将打开,但永远无法访问起始URL (命令行返回错误,程序停止)。这发生在我身上,不管我试图访问什么网站等。出于演示
的
目的,我在这里包含了一个非常基本
的
代码。我认为我没有正确地包含代码
的</
浏览 4
提问于2013-06-13
得票数 103
1
回答
无法通过
selenium
python打开网页
python
、
selenium
、
selenium-webdriver
、
web-scraping
、
automation
我是
selenium
python
的
新手,我正在尝试从一个网站上
抓取
数据
。下面是代码,其中我已经采取了所有必要
的
预防措施,以
避免
被阻止。from random import randrangefrom
selenium
.webdriver.chrome.options import():
proxy
= generate_
ip
_address()
浏览 109
提问于2021-07-17
得票数 0
3
回答
使用
Selenium
中
的
javascript禁用Google分析
selenium
、
google-analytics
、
selenium-webdriver
我正在
使用
selenium
测试一个生产站点。测试活度与分析方法紧密相连。 页面加载后,我可以通过
Selenium
禁用
使用
JavaScript
的
分析吗?我知道我可以通过
Selenium
执行JS。
浏览 6
提问于2013-12-24
得票数 4
回答已采纳
1
回答
如何
使用
scrapy在代理(2层)上进行代理?
python
、
proxy
、
scrapy
、
http-proxy
如何
使用
实现
proxy
over
proxy
(2层)?我假设这里是http/https代理。我为什么要这样做? 这样做
的
目的是隐藏我
的
ip
地址。你可以认为
proxy
1是非常可靠
的
,但
浏览 1
提问于2016-05-14
得票数 0
1
回答
为什么Facebook
的
帖子
抓取
变得非常慢,或者在几百篇帖子被
抓取
后停止?
selenium
、
facebook
、
web-scraping
、
beautifulsoup
、
rate-limiting
我试图用
Selenium
和BeautifulSoup
抓取
Facebook品牌社区页面上从2016年开始
的
所有社区帖子,比如this。我想将这些
数据
用于一个研究项目,我打算取消识别这些
数据
,并随后删除任何可识别的
数据
。 在
抓取
300-500个帖子后,其余
的
帖子加载速度非常慢,有时甚至不加载。这可能是因为Facebook为个人用户设置
的
数据
速率
限制
。 我想知道我怎样才能克服这个问题。当我达到这样
浏览 27
提问于2021-09-13
得票数 0
2
回答
我想在不
使用
vpn或代理
的
情况下更改
ip
地址
python
、
proxy
、
ip-address
、
vpn
我
抓取
了一些页面,这些页面检查我
的
IP
是否是vpn或代理(假
IP
)如果发现是假
的
站点正在阻止我
的
请求请看是否有方法可以每x次
使用
真实
IP
更改我
的
IP
而无需
使用
vpn或代理或重启路由器注:我正在
使用
Python
浏览 26
提问于2021-11-16
得票数 0
2
回答
在firefox webdriver选项中排除开关
python
、
selenium
、
selenium-firefoxdriver
通过
使用
Selenium
和python,我可以
使用
Chrome webdriver
来
实现以下功能:driver = webdriver.Chrome(options = options) 但是我找不到Firefox
的
webdriver选项
的
类似属性。
浏览 34
提问于2019-07-20
得票数 15
1
回答
使用
Ajax加载
的
表单登录(scrapy):
selenium
vs scrapy-splash
python
、
selenium
、
web-scraping
、
scrapy
、
scrapy-splash
要
抓取
我想要
的
网页,我需要登录。要访问表单
中
的
日志,我必须单击一个按钮。该按钮发出一个AJAX请求,该请求显示表单。我已经看到,我可以
使用
与似乎是一个更好<
浏览 8
提问于2017-12-18
得票数 0
1
回答
如何将默认
的
代理设置配置为python
中
selenium
的
Firefox (geckodriver)上
的
“自动检测代理设置”?
python
、
selenium
、
firefox
、
proxy
当涉及到用
selenium
进行web
抓取
时
,我是个初学者,
使用
python比较新,但是我一直在尝试通过FireFox访问bing搜索上
的
酒店列表,而且我一直在获取from
浏览 18
提问于2022-05-26
得票数 0
1
回答
从代理ips列表中选择最佳代理
ip
的
算法
algorithm
、
data-structures
我
使用
代理ips列表来
抓取
它们,比如
ip
1,
ip
2, ...,
ip
10。每当我从一个站点(比如site5 )
抓取
任何页面
时
,我都会调用一个函数getProxyFor(site5),该函数为我提供了从site5请求页面
时
应该
使用
的
代理
ip
。所以最基本
的
问题是 从每个都有几个属性
的
项列表
中
,我希望通过查询一个或多个属性
来
选择一
浏览 1
提问于2014-09-03
得票数 0
2
回答
实现
Selenium
以
使用
更改
的
身份验证代理
python
、
python-3.x
、
selenium
、
selenium-webdriver
、
selenium-chromedriver
我正在尝试让
selenium
使用
一个在某一
时
刻会改变
的
代理。options) 所以我导入了seleniumwire,因为我不确定普通
selenium
如何
使用
代理。现在,当我尝试在网站上运行程序进行测试
时
,如果它工作正常,我得到了下面的错误, Traceback (most recen
浏览 3
提问于2021-01-07
得票数 0
1
回答
生成有效
IP
地址列表&在Python循环中随机
使用
python
、
selenium
、
selenium-webdriver
、
ip-address
免责声明:这是我第一次尝试网络
抓取
“您对VINELink.com
的
访问已被拒绝,原因是利用率高于正常水平……您正试图从以下
ip
地址访问本网站。请确保防火墙设置没有
限制
访问。我
的
IP
地址。” 是否有方法生成有效
的
随机
IP
地址列表,在循环中随机选择
浏览 1
提问于2018-11-23
得票数 1
回答已采纳
2
回答
硒与Tor旋转
IP
python
、
selenium
、
tor
我有一个用于
抓取
的
selenium
配置--一个特定
的
HTTP请求,这个请求只有在我单击网站
的
一个特定
的
REACT元素
时
才发送。所以我才用硒..。找不到别的办法了。我必须更新我
的
IP
,每次我想刮这个特定
的
HTTP请求。为了达到这个目的,我
使用
了Tor。当我启动python脚本
时
,它运行得很好,Tor设置了一个新
的
ip
,并刮掉了我想要
的</e
浏览 0
提问于2019-07-02
得票数 0
回答已采纳
1
回答
变色驱动器中用于擦拭
的
代理程序更改
python-3.x
、
selenium
、
google-chrome
、
proxy
、
selenium-chromedriver
我正在用
selenium
和Chrome
抓取
Bet365,这可能是我遇到过
的
最棘手
的
网站之一。这个页面的问题是,即使我
的
刮刀需要睡觉,但它无论如何也不会比人类跑得更快,有时候,它会阻止我
的
ip
从随机
的
时间(半小时到两个小时)
中
消失。我<
浏览 0
提问于2019-06-01
得票数 0
2
回答
TypeError:__init__()获得了一个意外
的
关键字参数'service‘错误,
使用
Python和公司pac文件
python
、
selenium
、
google-chrome
、
selenium-webdriver
、
selenium-chromedriver
我试图
使用
selenium
来
使用
pac文件从公司代理后面的URL
中
抓取
数据
。我
使用
Chromedriver,我
的
浏览器在它
的
配置中
使用
pac文件。最初,我试图用漂亮
的
汤进行网络
抓取
,除了我现在需要
的
数据
是在javascript
中
,而javascript是无法用bs4读取
的
。Options from
se
浏览 9
提问于2021-12-30
得票数 4
回答已采纳
1
回答
用BeautifulSoup从图像标签Src属性中提取JPG
javascript
、
python
、
html
、
web-scraping
、
beautifulsoup
我是刮这个个人
使用
的
网页,和运行问题,提取每个项目的缩略图在页面上。当我
使用
“检查”
来
查看html DOM
时
,我可以查看包含我需要
的
..jpg
的
图像标记,但是当我
使用
“查看页面源”
时
,img标记就不会出现。起初,我认为这可能是一个异步
的
javascript加载问题,但是一个可靠
的
消息来源告诉我,我应该能够用漂亮
的
汤直接刮掉缩略图。a“标记
的
href属性
的<
浏览 0
提问于2018-02-08
得票数 1
回答已采纳
1
回答
如何将
IP
循环集成到我
的
网络
抓取
程序
中
?我一直被Crunchbase屏蔽
python
、
csv
、
web-scraping
、
ip
我写了一个程序,
使用
Beautiful Soup从Crunchbase提取公司列表
的
资金信息,并将这些信息导出到CSV文件
中
。我甚至将我
的
请求间隔了30秒,直到今天,程序都运行得很好--现在我甚至不能发送一个请求,除非得到一个HTTPError: Forbidden。我一直在读这篇文章,人们已经制作了
IP
循环程序,因为看起来Crunchbase已经屏蔽了我
的
IP
地址-即使我循环我
的
用户代理,我仍然被阻止。我甚至试过
使用
几个免费
浏览 21
提问于2019-06-14
得票数 0
回答已采纳
1
回答
如
何在
更换代理
的
同时在多个docker容器
中
运行
selenium
?
python-3.x
、
selenium
、
docker
、
selenium-webdriver
提前感谢你们所有人
的
耐心和好意。我刚接触docker,很难
使用
它
来
完成我
的
任务。请让我知道,如果我张贴了任何错误,而不是投票。我正在研究一个爬虫项目,并尝试
使用
docker +
selenium
+多个代理。这是我理想
的
工作流程:一台机器包含多个容器,一个爬虫(
Selenium
)脚本在一个容器
中
运行,每个脚本将完成“
抓取
和渲染网站->提取信息->更新本地
数据
库”
的
过程。
浏览 1
提问于2019-10-19
得票数 0
1
回答
chrome --无头模式不工作,但正常模式工作正常
python
、
selenium
、
google-chrome
、
selenium-webdriver
、
selenium-chromedriver
我对chrome
使用
了下面的代码--headless模式,但是代码不能正确执行。代码在正常模式下工作正常。EC.element_to_be_clickable((By.XPATH, "//button[text()='Not Now']"))).click() File "/usr/local/lib/python3.8/dist-packages/
selenium
webdriver/support/wai
浏览 4
提问于2021-12-01
得票数 1
点击加载更多
相关
资讯
Python爬虫防封的6个小诀窍
5 个方法实现 Python 编写另类应用
网页数据抓取是什么?为什么要使用海外住宅代理?
使用Python进行网页抓取的介绍
爬虫入门——详解Python是如何进行网页抓取!
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
语音识别
活动推荐
运营活动
广告
关闭
领券