腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Selenium
webdriver
无法获得一个元素
、
、
、
、
我想创造一个
爬虫
/刮刀。以及我想爬的元素,在我看来是为
JS
服务的。在我的浏览器中,我可以看到这个元素,但是在
webdriver
上,我看不到这个元素。例如,URL: 但是在chrome上,我看不到这样的元素:我的网络驱动程序代码是这样的:driver =
浏览 0
提问于2021-04-08
得票数 0
回答已采纳
1
回答
在Python中启动google-chrome的正确方法
、
、
我正在尝试使用subprocess从python启动google-chrome,但到目前为止还没有成功。基本上我有一个bash命令,如下所示: --no-first-run \ --disable-translate \ --disable-extensions \ --disable-
浏览 32
提问于2019-07-14
得票数 0
1
回答
如何将html传递给Selenium?
、
、
、
我有一个网络
爬虫
,我想把它检索到的html+javascript传递给selenium,这是可能的吗?为了澄清,我不想使用
webdriver
.get检索selenium的页面,因为我的
爬虫
更快。
浏览 3
提问于2013-07-13
得票数 1
回答已采纳
2
回答
Selenium没有加载TikTok页面
、
、
、
我正在使用selenium和scrapy实现一个TikTok
爬虫
.... options =
webdriver
.ChromeOptions() ua(chrome_options=options)<e
浏览 6
提问于2019-12-10
得票数 5
1
回答
如何使用PHP从另一个网站获取数据并将其存储在MySQL数据库中?
、
、
我需要使用PHP从网站中获取数据,并将其保存在MySQL数据库中。我还想获取图像并将它们保存在我的服务器中,以便在我的站点中显示它们。我听说可以使用API,但是我想知道我是否可以使用CURL来完成这个任务。我想每天获取大量的数据,那么使用CURL会消耗大量的服务器端资源吗?还有哪些其他方法可以获取数据?
浏览 5
提问于2011-08-17
得票数 1
1
回答
如何优化Selenium
webdriver
爬虫
?
、
、
、
代码如下: driver =
webdriver
.Chrome('.
浏览 2
提问于2021-10-10
得票数 0
2
回答
如何在Windows10中用python编写Selenium
Webdriver
路径地址?
、
、
、
我正在用Python和selenium做一个简单的网络
爬虫
。(在PyCharm Window 10上运行)from selenium import
webdriver
driver.get(http://www.python.org) 我尝试了文件路径的各种格式,但似乎都返回了错误。
浏览 3
提问于2017-07-14
得票数 0
回答已采纳
1
回答
使用多个爬行器运行Selenium无头
、
、
我有许多使用scrapyd并行运行的scrapy
爬虫
。我正在做的事情类似于下面的代码。 self.display.start() self.driver =
webdriver
.Firefox
浏览 1
提问于2016-03-04
得票数 7
1
回答
Selenium:带有InvalidSelectorException子级的XPath::node()
、
、
我在Chrome上尝试了这些带有XPathHelper扩展的XPathHelper,它的工作原理和意图一样,但似乎不适用于Selenium (Chrome、
WebDriver
和PhantomJS)。
浏览 2
提问于2016-11-17
得票数 0
1
回答
从代码中获取所有href
、
、
、
、
我在做一个网络
爬虫
。为了在页面中查找链接,我使用了selenium中的xpathdriver.get(side)driver =
webdriver
.Firefox()Listlinkera = driver.find_elements
浏览 0
提问于2011-12-20
得票数 1
回答已采纳
1
回答
更改IP地址Python Selenium
、
、
、
我尝试使用Python Selenium运行代码import time profile.set_preference("network.proxy.http_port",82) driver=
webdriver
.Firefox我正在开发一个网络
爬虫
,需要更改ip
浏览 37
提问于2016-08-30
得票数 2
回答已采纳
1
回答
如何在Go中刮动网站?
使用NodeJS,我可以使用PhantomJS来帮助我抓取动态网站,使用PhantomJS,我可以使用Selenium来完成这项工作。
浏览 2
提问于2017-07-05
得票数 1
2
回答
web爬行工具,支持在开始爬行之前与目标站点进行交互
、
我正在寻找一个
爬虫
,它能够处理与Ajax的页面,并能够在开始爬行网站之前与目标网站执行某些用户交互(例如,点击某些菜单项,填写一些表格等).I尝试
webdriver
/selenium (这是真正的网络抓取工具),现在我想知道是否有任何
爬虫
程序,支持模拟某些用户交互之前开始爬行?
浏览 1
提问于2011-06-28
得票数 0
1
回答
如何在更换代理的同时在多个docker容器中运行selenium?
、
、
、
我正在研究一个
爬虫
项目,并尝试使用docker + selenium +多个代理。这是我理想的工作流程:一台机器包含多个容器,一个
爬虫
(Selenium)脚本在一个容器中运行,每个脚本将完成“抓取和渲染网站->提取信息->更新本地数据库”的过程。): if driver is None: chromeOptions =
webdriver
.ChromeOptions但我仍然不知道是否应该
浏览 1
提问于2019-10-19
得票数 0
1
回答
使用Python Selenium和PhantomJS获取AJAX内容
、
、
、
、
我正在编写一个
爬虫
,需要等待所有AJAX加载的HTML内容,然后从他们提取任何锚标签。当我调用
webdriver
.get(URL)时,我不确定它实际上是在等待将某些AJAX内容添加到DOM中。然而,即使在等待之后,
webdriver
.page_source也与等待之前一样。有没有什么方法可以让我在等待之后将AJAX内容放入
webdriver
.page_source中,以便分析异步插入的内容?
浏览 0
提问于2013-06-11
得票数 4
9
回答
禁用chrome下载多个文件确认
、
、
、
、
我用ruby watir-
webdriver
开发了一个
爬虫
,可以从页面上下载一些文件。我的问题是,当我点击下载第二个文件时,Chrome会在顶部打开一个栏,要求确认我正在从这个网站下载多个文件。一旦
webdriver
使用了它,我就无法确认下载。有什么方法可以避免这种确认吗?我在想,是否有任何配置可以避免它,或者是否有扩展来做到这一点,或者即使我可以点击
webdriver
的确认。 谢谢
浏览 1
提问于2013-04-05
得票数 18
1
回答
可以将pyexecjs与scrapy一起使用吗?
、
、
、
、
不久前我偶然发现了pyexecjs,我想知道它是否可以与scrapy一起用于抓取
JS
生成的数据。 我检查了应该如何使用该库的示例,但我不确定如何将其与scrapy集成。
浏览 4
提问于2014-10-12
得票数 0
1
回答
如何为selenium和Scrapy编写定制下载中间件?
、
我在selenium和scrapy object之间的通信有问题。谢谢!
浏览 2
提问于2016-10-27
得票数 3
1
回答
只更新一次for驱动程序并将其用于各种函数和循环
、
、
、
我有一个简单的网络
爬虫
,我会在一个循环中使用它来抓取youtube视频中的信息,如下所示from
webdriver
_manager.chromeimport ChromeDriverManager options =
webdriver
.ChromeOptions()driver =
webdriver
.Chrome(executable_path=ChromeDriverM
浏览 2
提问于2022-03-14
得票数 0
回答已采纳
1
回答
Windows: Selenium
webdriver
.Firefox挂起
、
我正在运行一个使用selenium和firefox
webdriver
的
爬虫
程序。我的程序在mac/ubuntu上运行成功,但在windows上运行。
webdriver
.Firefox() 打开一个新的geckodriver窗口(类似cmd的窗口),然后就挂在那里了。程序在那之后就不会继续前进了。
浏览 9
提问于2017-02-04
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python爬虫入门,快速抓取大规模数据4
爬虫之旅(2)——网页知识储备html、css及js
Python+selenium自动化-PhantomJS
解决爬虫无法获取动态网页内容的方法
收藏学习:Selenium webdriver API 大全
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券