腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(4341)
视频
沙龙
1
回答
用
硒
刮掉
生菜
直到
流
的
尽头
、
、
、
我在试着
刮掉
youtube上
的
直播。我需要保存所有旧
的
和传入
的
消息。为此,我使用css选择器和无限循环来完成此操作,但是这会导致重复
的
条目和先前
的
消息被省略。这样做
的
正确方法是什么?
浏览 4
提问于2020-08-22
得票数 0
1
回答
如何使用scrapy或selenium抓取动态页面?
、
、
、
、
我正在尝试抓取web动态页面,但使用scrapy时,我不能检索所有信息,因为我想要
的
信息是动态
的
。 我试着使用Selenium,但与Scrapy不同
的
是,你不能指定头部,网站阻止了我。(我不能说出这个网站
的
名字,因为抓取是非法
的
,但它是一个著名
的
旅游元搜索引擎...)。我有一个带有验证码解算器
的
页面(
用
脚本很难解决重新验证码),因为网站会检测到我是机器人。我想拥有所有的动态信息,并有权访问网站,但不可能与selenium和scrapy没有给我所有我想要
浏览 23
提问于2019-06-13
得票数 0
1
回答
如何滚动元素
直到
某个单词出现?
、
、
、
、
我正在抓取谷歌地图,我需要知道如何滚动查询列,
直到
单词出现我
用
硒
刮。我目前使用
的
代码: barraRolagem = wait.until(EC.presence_of_element_located((By.XPATHdriver.execute_script("arguments[0].scroll(0, arguments[0].scrollHeight);", barraRolag
浏览 2
提问于2022-11-23
得票数 1
回答已采纳
1
回答
用
硒
刮掉
完整
的
帖子
、
、
、
、
代码运行正常,但它崩溃并将单个作业导出到我
的
csv,我认为这是随机
的
,没有给任何error.Please,一个有更多经验的人可以提前帮助我一些tips.Thanks。
浏览 20
提问于2021-05-22
得票数 0
回答已采纳
1
回答
用
beautifulsoup4从天才网站抓取评论
、
、
、
、
我想问一下,在您看来,是否有可能用beautifulsoup4
刮掉
genius.com
的
评论。我问这个问题是因为当我
用
bs4抓取页面时,我找不到注释
的
部分,因为它们在一个可扩展
的
容器后面。如果我从浏览器中查看页面的html,即使我没有点击“展开”按钮,也可以看到注释,但是当我
用
bs4抓取时,我在html源代码中找不到它们。 我怎样才能解决这个问题?有一种方法可以
用
bs4
刮掉
评论吗?还是我应该用
硒
?(我想避免使用selenium,因为我
浏览 2
提问于2021-12-15
得票数 -1
1
回答
从电子邮件下载PHP
、
、
、
我们目前有一个PHP脚本,可以访问我们
的
电子邮件,并为语音邮件
的
目的提取要访问
的
.wav文件。但是新
的
语音邮件系统发送
的
.wav是这样
的
:01359272577 03-14-16 20h14.wav,旧
的
系统就是这样做
的
:msg100.wav。编辑
的
见下面没有SQL
的
新脚本。它所做
浏览 3
提问于2016-03-15
得票数 3
3
回答
Python中
的
抓取-防止IP禁令
、
、
、
直到
现在我还没有什么复杂
的
问题。使用Requests和lxml,我能够在被IP禁止之前
刮掉
大约100到150页。有时我甚至被禁止第一次请求(新
的
IP,以前没有使用,不同
的
C块)。我尝试过欺骗头,在请求之间随机化时间,仍然一样。 我试过
硒
,结果好多了。使用Selenium,我能够在被禁止之前
刮掉
大约600-650页。在这里,我还尝试将请求随机化(在3-
浏览 6
提问于2016-02-01
得票数 19
1
回答
PrintWriter不会写
、
、
、
我编写了一个简单
的
Echo Server和Echo客户端,但问题是,在服务器
的
循环中,我从缓冲
的
Reader读取,程序卡住了,它不会写。e.printStackTrace(); } // end of main我
的
问题是为什么它会被困在循环中
浏览 2
提问于2016-10-12
得票数 1
回答已采纳
1
回答
如何用python requests.get“跳过”第一个响应
、
、
当我在浏览器中打开网站target.url时,我想自动获取一些信息,一个简短
的
加载屏幕显示,然后显示信息。所以当我
用
write_to_disk(resp.text) 我只获得加载屏幕动画,因为它
的
第一个响应到这个网站
的
http请求。是否有一种“跳过”此响应或建立连接并通过此连接发送多个请求
的
方法?我试过几件事,但没有一件对我有用:)
浏览 0
提问于2021-09-28
得票数 0
回答已采纳
1
回答
nodejs
流
可读
的
第一个可读对象
、
、
我有一个 util = require('util'), ReadableStream.call(this, { objectMode: true }); ArticleReader.prototype._r
浏览 4
提问于2014-11-05
得票数 1
回答已采纳
2
回答
ImportXML Google工作表生成导入
的
内容为空
、
、
、
、
但是当我从Google
的
检查工具中复制XPath,并在我
的
Google中使用它时,我会得到一个“导入内容是空
的
”N/A错误。 有什么帮助吗?
浏览 3
提问于2020-03-26
得票数 1
回答已采纳
3
回答
FileReader.read()何时返回-1以及如何处理?
此方法将被阻塞,
直到
某些输入可用,发生I/O错误,或到达
流
的
末尾。返回:读取
的
字符数,或者-1 (如果是,
流
的
末尾已经到达)。抛出: IOException -如果发生I/O错误 当读取完文件中
的
数据时,是否到达
流
的
结束?那么,为什么read返回读取
的
字符数,而不是-1?下面的代码没有检查和
浏览 6
提问于2017-11-22
得票数 0
3
回答
在Django中测试工作
流
、
、
、
、
我真的很喜欢测试和构建单元测试,但我发现必须为网站
的
工作流程构建测试是很烦人
的
。(例如)或即使在使用Selenium之类
的
应用程序时,也要遍历每次迭代,然后检查电子邮件等是否有更有效地执行一系列测试
的
方法? ,你们是怎么做到
的
?:)
浏览 10
提问于2010-09-07
得票数 6
1
回答
TcpClient.GetStream().CopyTo(MemoryStream)阻止应用程序继续运行?
、
、
、
我试图执行一些非常基本
的
网络操作,但我遇到了一些麻烦。最初,我试图使用NetworkStream.Length创建一个新
的
byte[],但是很明显,这是不可能
的
,因为NetworkStream不支持寻求操作。然后,我找到了一些示例,展示了如何将NetworkStream复制到允许查找操作
的
MemoryStream中。到现在为止还好。 还是真的是这样?一旦using语句
的
作用域被击中,应用程序实际上就停止了。它还在跑,还在做些什么,但我真的说不出是什么。我需要将我
的
NetworkStrea
浏览 3
提问于2013-10-11
得票数 1
回答已采纳
1
回答
用
Python实现IP-Cam
的
记录帧
、
、
我正努力保护一架ip摄像头
的
安全。凸轮流(h264 mp4 avc -表示vlc)并支持rtsp和onvif。所以我可以在vlc中看到
流
。 你还有其他建议吗?
浏览 0
提问于2015-04-05
得票数 1
回答已采纳
1
回答
如何用JS“加载更多”按钮从网站上抓取数据
、
、
、
我试着
用
JS刮谷歌奖学金网站。表底部有一个"Load more“按钮。有关参考,请参见以下页面: 显然,我在"Load more“按钮上使用了btn.click(),
直到
按钮被”禁用“为止。有人能告诉我一种更好
的
方法来
刮掉
整个表数据吗?
浏览 3
提问于2020-06-10
得票数 0
1
回答
第二个套接字写入似乎没有发送到网络。
、
、
我正在创建一个简单
的
网络客户端。它读取一个文本文件并将每一行放到网络中。在远端,有一个服务器读取传入行并使用CSV文本行进行响应。我用于测试
的
传出文件很简单:6216448319,理查德·尼克松,注销 响应应该是“登录”。然后是“注销”。第一行处理得很完美,但是虽然第二行似乎是写到套接字上
的
,但是服务器从未看到传入
的
消息。我已经尽了最大
的
努力在网上遵循文档和各种教程,但我所看到
的
似乎都没有表现出相同
的
行为。我遗漏了什么?如果
浏览 2
提问于2017-10-02
得票数 0
回答已采纳
2
回答
我
的
Java套接字在线程中使用时是否保持打开状态?
、
、
我正在编写一个简单
的
Java服务器,它接受多个客户端套接字连接。我使用一个单独
的
线程来处理每个客户机/套接字。考虑到我已经为这个客户机/套接字建立了包括BufferedReader、InputStreamReader和FileWriter等在内
的
网络。我
的
代码是:public void run(){ String message还是套接字在完成从<em
浏览 0
提问于2018-09-04
得票数 1
2
回答
如何处理负载平衡服务器上
的
wesocket连接
、
、
、
、
我们
的
.net核心web应用程序目前接受websocket连接,并将某些事件(编辑、删除、创建某些实体)
的
数据推送给客户端。基本上,如果我正确理解的话,只有处理特定事件
的
节点才会将数据推送给它
的
客户端,而连接到其他节点
的
客户端都不会得到更新。 什么是普遍接受
的
处理这个问题
的
方法?我能想到
的
最好
的
方法是也将相同
的
事件发送到集群中
的
所有节点,以便它们也可以更新它们
的
客户端。这个是可能<
浏览 14
提问于2017-10-24
得票数 1
回答已采纳
1
回答
页面需要2次加载才能完成
、
、
、
这就是为什么数据不被
刮掉
的
原因。我
的
守则:from bs4 import BeautifulSoupsold = soup.find_all("span", class_='ng-binding')我也尝试
浏览 6
提问于2022-09-15
得票数 -1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
神舟十八号航天员把生菜吃成“老桩”,太空菜园太棒了,技能叠满
全球首个硒-硅单片叠层太阳能电池:有望突破单结光伏效率极限
60年前不被看好的理论再次被证,这次是原子层面的
激光焊锡作业中锡不流动怎么办?
萨莉亚:外卖平台永远的痛
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券