腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
可能的反爬行者
、
我想我会写一个
爬虫
,从www.wordreference.com获取单词。我在机械化
爬虫
框架中使用Python。这个网站有没有可能有
防
爬虫
机制?
浏览 5
提问于2011-04-07
得票数 1
回答已采纳
1
回答
如何在检测响应状态中的代码500时自动增加scrapy的DOWNLOAD_DELAY
、
、
、
我将编写数百个
爬虫
来抓取不同的静态网页,所以我选择Scrapy来帮助我完成我的工作。 在工作过程中,我发现大多数网站都很简单,不会
防
蜘蛛。我想知道哪些型号的
爬虫
加载和使用DOWNLOAD_DELAY参数,以及如何编写程序在检测服务错误时自动增加DOWNLOAD_DELAY (
爬虫
请求太频繁)。
浏览 2
提问于2019-01-17
得票数 1
1
回答
Scrapy访问被拒绝爬取网站的头部
、
、
、
网站有没有
防
爬虫
的方法?如何抓取这个网站?
浏览 27
提问于2020-07-14
得票数 1
回答已采纳
1
回答
Symfony DomCrawler如何单击执行
js
代码的链接
、
、
、
、
如何使用
爬虫
来
点击
执行
js
代码的链接,这个链接没有HREF属性。
爬虫
可以通过客户端在页面上执行
js
代码吗?
浏览 82
提问于2021-02-03
得票数 0
1
回答
如何防止未经授权保存到数据库?
、
、
、
、
我正在构建一个简单的
点击
器游戏,可以在线玩。 游戏通过执行对php脚本的Ajax post调用,将
点击
保存到我的数据库中。我将
点击
保存到本地存储,我知道这是另一个人们可能作弊的地方。 我该怎么做才能只允许来自我的服务器的帖子?
浏览 7
提问于2021-09-08
得票数 1
1
回答
那些特别难以抓取和刮的网站?
、
、
我对面向公共的站点(登录/身份验证后没有任何内容)感兴趣,这些站点的内容如下: 非语义的,或无效的标记我已经建立了一个
爬虫
/蜘蛛,执行一系列的分析在网站上,我在寻找网站,将使它的斗争。
浏览 1
提问于2013-09-12
得票数 11
1
回答
Scrapy spider不存储状态(持久状态)
、
嗨,我有一个基本的蜘蛛,运行来获取给定的域上的所有链接。我希望确保它保持其状态,以便可以从它离开的地方恢复。当我第一次尝试时,我遵循了给定的url .But,它运行得很好,我以Ctrl+C结束它,当我试图恢复它时,爬行会在第一个url上停止。2016-08-29 16:51:08 [scrapy] INFO: Dumping Scrapy stats: 'downloader/request_count': 4, 'downloader/request_m
浏览 20
提问于2016-08-30
得票数 3
2
回答
如何单击PHPUnit (Symfony2)中的按钮
、
、
、
、
Hi,我正在编写一个函数测试,我想知道如何对一个按钮执行简单的单击,我有一个隐藏的表单,显示在按钮单击后$button = $crawler->filter('button
浏览 4
提问于2015-03-19
得票数 4
回答已采纳
1
回答
sendkeys在Appium RemotewebDriver中不能正常工作
、
、
、
我正在使用Appium 1.4.16在真正的android设备中自动存储在我的系统中的apk文件。我使用的是java-client 3.4.1,代码如下: capabilities.setCapability("dev
浏览 0
提问于2016-06-03
得票数 1
3
回答
如何解除
防
点击
?
我希望当我
点击
任何类别时,它应该正确地转到那个页面。请帮帮我。
浏览 1
提问于2014-01-15
得票数 0
1
回答
Googlebot执行谷歌标签管理器吗?
、
、
、
我想了解Googlebot (和其他
爬虫
)如何爬行我的网站。具体而言,它是否传递一个document.referrer,如果它维护localStorage密钥,那么我通过Google实现了一个脚本,该脚本检测这些
爬虫
并将数据记录到Logstash。这是我用来检测
爬虫
用户代理的条件(为
爬虫
返回true ):if(navigator.userAgent.indexOf('robot de Google') < 0 &&;
js
= d.cr
浏览 0
提问于2018-02-09
得票数 4
回答已采纳
1
回答
google crawl ajax
、
我有一个结果页面,结果是用ajax加载的,这意味着分页按钮正在调用
JS
。链接到结果页是美丽的‘/结果/销售/06589’,我会引导谷歌到这个页面,但有没有办法让
爬虫
机器人
点击
分页按钮。
浏览 0
提问于2011-06-04
得票数 1
3
回答
基于回合的游戏分数记录
、
、
我正在使用php和jquery开发一个非常、非常基本的回合制游戏,我正在寻找两种不同的方法来跟踪当前用户的分数: 1) global javascript variables -例如
js
开头的var currentScore我试图在a)加载速度和b)使分数
防
篡改之间取得平衡。我认为本地javascript会更快,更少的加载时间,但mysql记录会更
防
篡改。有没有人有任何建议,关于哪个更快,哪个更
防
篡改,或者可能有其他我没有列出的实现方法?
浏览 1
提问于2012-11-28
得票数 2
回答已采纳
2
回答
上一个JavaScript文件并不总是被加载的罪魁祸首是什么?
、
、
总的顺序如下:foo.
js
做的事现在,在一个完美的世界中,我希望看到对foo.
js
和bar.
js
然而,bar.
js
只加载了94%的时间。我想知道,考虑到bar.
js
延迟1到2秒的事实,这种差异在多大程度上可以归因于站点放弃。
浏览 0
提问于2011-06-29
得票数 4
4
回答
如何通过
爬虫
php获取悬停数据(Ajax)
、
、
、
有没有可能用任何
爬虫
。 我使用PHP和来解析/抓取页面。
浏览 3
提问于2012-03-30
得票数 3
回答已采纳
6
回答
如何识别网络
爬虫
?
、
我怎样才能过滤掉网络
爬虫
等非人类的
点击
。 我使用maxmind.com向IP请求城市。这并不是很便宜,如果我必须支付所有的
点击
,包括网络
爬虫
,机器人等。
浏览 3
提问于2011-12-07
得票数 33
回答已采纳
1
回答
爬行url \如何在node.
js
中获取动态链接
、
我正在使用
js
爬虫
来抓取网站,现在我遇到了CNN,的那一部分(基于某种原因动态生成的urls)。事情是
爬虫
,不要真正接触脚本-我应该如何解决它?除了我的node.
js
爬虫
之外,我还应该编写自己的代码吗?是否有先进的
爬虫
知道如何处理这种动态行为?
浏览 1
提问于2016-07-23
得票数 2
回答已采纳
2
回答
如何使用OpenGL ES 1.0在两个矢量之间动态绘制直线
、
、
、
、
假设我有一个塔楼和一个生物
爬虫
(如果你猜不到的话是塔
防
游戏),它们的位置都由(object).position.x和(object).position.y表示,其中position是一个向量。
浏览 1
提问于2013-01-31
得票数 0
1
回答
来自服务器上Facebook IP的请求
、
我们在我们的服务器上收到来自Facebook IP地址的请求,这些地址不会在广告管理器中显示为
点击
。我们想知道这是因为Facebook通过他们的服务器重新路由流量,还是Facebook使用了某种
爬虫
来测试广告中链接的页面? 对于我们的内部统计数据,我们希望只计算真实的访问量。
浏览 2
提问于2018-06-01
得票数 0
1
回答
web
爬虫
点击
网页上的特定元素的逻辑是什么?
、
、
、
、
我已经编写了一个
爬虫
应用程序,它打开给定的网页,并将HTTP请求和存储在excel表中。所以简单地说,我如何让我的
爬虫
点击
按钮?
浏览 2
提问于2013-11-09
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
新技术栈爬虫工具 Crawlee:功能强大,自适应并发,支持 JS 渲染和防封锁
爬虫如何防被封IP
对抗蠕虫——如何让按钮不被 JS 自动点击
JavaScript的使用:如何让按钮不被 JS 自动点击
PhantomJS+Selenium轻松爬虫及模拟网页点击
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券