腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(1755)
视频
沙龙
1
回答
如何
限制
非
谷歌
搜索引擎
机器人
的
爬行
速度
,
使
它们
不
会使
我
超过
外部
API
请求
限制
?
我
正在为一个客户建立一个亚马逊附属网站,使用亚马逊产品
API
从他们
的
目录中获取数据。
我
需要关于
如何
去对待其他
搜索引擎
爬虫
机器人
的
建议。有什么好方法可以尽可能地避免由于
机器人
爬行
而
浏览 17
提问于2016-09-16
得票数 1
1
回答
IIS动态IP
限制
模块与Googlebot
、
、
、
、
我
考虑使用IIS动态IP
限制
模块来增加DoS (拒绝服务)攻击
的
难度。但我不确定
谷歌
机器人
这样
的
搜索引擎
机器人
会
如何
运作。 有什么想法吗?
浏览 0
提问于2012-02-28
得票数 5
1
回答
在bing内每秒计算
请求
、
、
、
在中,
我
能够设置Google
爬行
我
的
站点
的
速度
,并告诉
我
一些细节,比如每秒
的
请求
和
请求
之间
的
秒数。在必应网站管理员工具中,
我
只能选择当它爬到网站上时,
我
能爬到多高
的
位置。有人知道
如何
将
爬行
速率图转换为每秒
的
请求
吗?
我
这么问是因为
我
想
浏览 0
提问于2016-03-30
得票数 1
1
回答
防止“好
机器人
”发出可收费
API
调用
的
SEO处罚?
我
的
网站页面从
机器人
获得8到10倍
的
流量,而不是从真正
的
用户。
我
在日志里看到了将近90个不同
的
机器人
。从定义上来说,
它们
都是“好
机器人
”。主要是
搜索引擎
爬行
器、
搜索引擎
搜索引擎
索引器(如ahrefs和数字广告网络)。
我
的
问题是成本。
我
使用Google和Places,并在每个
API</e
浏览 0
提问于2019-04-26
得票数 2
2
回答
如何
限制
Google
爬行
某些URL模式?
、
、
、
、
30个属性过滤器,就可以有许多
它们
的
组合,因此可以以指数方式增加Google
的
所有可用URL数量,例如:www.domain.com/product-category/filter2/filter4或www.domain.comGoogle
的
流量给我们带来了很大
的
打击,因为现在只有30 this
的
流量是持续
的
--仅对Google来说就有30 this,现在从我们
的
领域索引大约有1亿页(在这个过滤功能之前,我们有大约5000
浏览 0
提问于2020-04-02
得票数 3
回答已采纳
3
回答
分布式速率
限制
、
、
、
、
我
有多个服务器/工作者在处理
API
请求
的
任务队列。(使用Memcached和Celery作为队列
的
Django)
API
请求
被
限制
为每秒10个
请求
。
如何
对其进行速率
限制
,
使
请求
总数(所有服务器)
不
超过
限制
?
我
已经看过了一些相关
的
速率
限制
问题,<e
浏览 0
提问于2012-12-17
得票数 6
3
回答
允许所有
机器人
robots.txt
、
在
我
的
robots.txt文件中,
我
列出了不允许在
我
的
站点上索引
的
机器人
列表,其余
的
我
必须允许所有其他
机器人
,但是
我
想知道这两条规则之间
的
真正区别:Disallow: 这是
浏览 0
提问于2011-09-22
得票数 4
2
回答
使用GoDaddy管理
的
Wordpress托管和Cloudflare
的
Google工具中
的
许多"429“
爬行
错误
、
、
、
以下设置:Cloudflare作为CDN在
我
添加Cloudflare和SSL之前,它可以正常工作,没有任何缺陷。造成这一问题
的
更可能
的
原因是什么?
如何
进行最佳调试?
浏览 0
提问于2014-11-25
得票数 5
回答已采纳
1
回答
Google自定义搜索问题:由于达到每日
限制
,
请求
被节流
、
我们经常收到关于Google (自定义搜索JSON )在我们
的
网站上无法运行
的
报告://
API
callback"error奇怪
的
是,当这种情况发生时,我们不应该再访问
搜索引擎
,相反,它只是在一段时间后才重新开始工作;这些都是非常临时
的
锁定。 有没有办法通过验证查询/
请求
的
数量?如果是这样的话,请告诉
浏览 6
提问于2020-04-22
得票数 0
1
回答
Googlebot只获取
我
网站
的
资产
、
、
当我尝试在
我
的
网站页面上使用Fetch作为Google时,Googlebot会部分地获取它,当我检查
爬行
日志时,告诉
我
我
的
一些资产是暂时无法到达
的
:📷
我
该怎么办?
浏览 0
提问于2017-07-25
得票数 2
回答已采纳
1
回答
Instagram应用程序
的
上线过程
、
我
只是在做一个Node.js项目,它使用Instagram
API
通过关注用户特定
的
标签来提高用户
的
点赞/评论和追随者数量,并自动在用户之间创建喜欢和评论
的
有机纽带。或者你也可以把它叫做Instagram
机器人
。 然而,Instagram
API
的
速度
和用户
限制
让
我
对一些东西产生了好奇。因为
我
认为Instagram从来不会接受他们
的
API</em
浏览 0
提问于2016-03-28
得票数 1
2
回答
元无跟随与rel=
的
“nofollow”不同吗?
如果
我
把
我
的
网站<meta name="robots" content="nofollow" />,这是否防止传递果汁到我
的
网站上
的
所有链接(内部和
外部
)?meta中
的
nofollow与rel="nofollow"有什么不同吗?
浏览 0
提问于2013-06-20
得票数 2
回答已采纳
1
回答
我
能否减少Google
API
v3中
的
请求
量?
、
、
、
我
给两个地点打电话。从xml文件中,
我
得到了位置
的
长和长。先是最近
的
咖啡馆,然后是最近
的
学校。
我
做了两次这个函数verander(纬度,经度)。
我
知道这听起来很傻,但我真的很想知道他们是否是减少这些
谷歌
地图
请求
的
后门。在应用于Maps
API
的
使用
限制
的
上下文中,什么构成
浏览 2
提问于2013-07-04
得票数 2
回答已采纳
5
回答
谷歌
爬行
速度
--它能以多快
的
速度
前进?
、
、
我
有一个巨大
的
网站,有500万页。目前Google每天索引大约10,000页。这是非常缓慢
的
,
我
仍然有很多
的
网页,
我
无法得到索引。有人知道
爬行
速度
的
上限是多少吗?
浏览 0
提问于2013-09-09
得票数 3
回答已采纳
2
回答
Googlebot非常频繁地获取
我
的
页面,rel,meta或robots.txt-不允许。
、
、
、
、
Googlebot经常在
我
的
网站上获取页面。这让
我
的
网站变慢了。
我
不想让Googlebot爬得太频繁。在
我
的
内部页面中添加rel="nofollow“。所以Googlebot不会
爬行
和索引
它们
。添加“不允许”:/mySomeFolder/到robots.txt和Googl
浏览 0
提问于2012-12-18
得票数 2
2
回答
AngularJS SEO -一劳永逸
、
、
、
我
在一个有15个子站点和13个不同模式页面的大项目中。目前,该网站是基于ui.route
的
所有网页和我
的
数据集
的
$http角
请求
。经过在搜索控制台上
的
测试和试用,它看起来就像
谷歌
没有看到我
的
所有页面,除了主页和来自$http
请求
的
数据没有出现。
我
做错什么了?到目前为止
我
所做
的
是:<base
浏览 5
提问于2017-01-31
得票数 2
回答已采纳
2
回答
数据抓取时更改代理
、
、
、
、
我
用JSOUP库在Java中编写了一个数据抓取软件。
我
正在发布一些数据,并从提交
的
页面中获得结果。一切都是完美的,但是他们最近更新了网站,现在经过300-500
的
结果,这个页面对
我
来说是不可用
的
,它在接下来
的
几个小时内被破坏了。当我手动更改代理时:System.setProperty("http.proxyPort", proxyPort)
浏览 2
提问于2016-08-15
得票数 1
回答已采纳
3
回答
如何
使
谷歌
索引所有的sitemap.xml记录?
、
、
、
、
我
有一个sitemap.xml索引,其中包含3个XML文件,大约有120页用于索引。一年过去了,
我
仍然有1/3
的
索引。所有索引最重要
的
页面都在第一个站点地图文件中,但是Google从每个站点地图文件中获取了类似的数量。
我
已经将
爬行
率设置为GWT中
的
最大值。
浏览 0
提问于2014-02-23
得票数 1
回答已采纳
4
回答
有没有可能通过robots.txt控制
爬行
速度
?
、
、
我们可以在robot.txt中告诉
机器人
爬行
或
不
爬行
我们
的
网站。另一方面,我们可以在Google网站管理员中控制
爬行
速度
( Google
机器人
抓取网站
的
数量)。
我
想知道是否可以通过robots.txt
限制
爬虫活动
我
的
意思是接受
机器人
来抓取页面,但要根据时间、页面或大小
限制
它们
的
存在!
浏览 3
提问于2011-10-17
得票数 14
回答已采纳
1
回答
如何
配置GCP云任务队列,以适应第三方SLA下游
的
非常慢
的
调度?
、
、
、
我
需要设置一个云任务队列,将HTTP
请求
发送到第三方
API
。
外部
API
每分钟只能接受几个
请求
,
我
希望设置对云任务
的
速率
限制
,以便任务以非常慢
的
速度
流动:每15秒
不
超过
一个
请求
。从医生那里,
我
可以看到:max_dispatches_per_second max_concurre
浏览 14
提问于2021-12-09
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
影响谷歌抓取网页频率的因素有哪些?优化抓取预算有这几个妙招
爬取数据时防止爬虫被限制的四种方法
NGINX机器人程序流量缓解 减少不想要的Web流量
Python太慢了吗?
Python爬取数据之Requests库
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券