腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Robots
.txt阻止对所有https://页面的访问
阻止所有机器人访问https:// pages的语法是什么?我有一个旧网站,现在没有SSL,我想阻止访问所有https://页面
浏览 2
提问于2009-04-25
得票数 3
回答已采纳
2
回答
在多语言站点中使用`
robots
.txt`
、
、
如何将
robots
.txt文件与sitemap结合起来?ORmyBurger.com
浏览 1
提问于2015-04-28
得票数 1
回答已采纳
1
回答
我应该在Google网站管理员工具中删除旧的http属性吗?
、
、
、
、
我正在建立一个谷歌商业中心购物馈送的过程中,并收到来自谷歌的警报,让我知道他们有问题爬行我的网站图片,因为我的
robots
.txt文件的问题。我检查了Google WMT,发现我的https属性没有问题,但是我的旧HTTP属性被列为与
robots
.txt文件相关的“严重健康问题”。当我运行
robots
.txt测试器时,我得到了以下结果User-agent: *Crawl-delay: 10 我应该删除我的旧超文本传输
协议
属性从谷歌WMT或其他我应该做的事情,例如3
浏览 0
提问于2016-04-21
得票数 0
1
回答
如何阻止来自特定目录的bot
、
、
、
在我的网站上的/cachecp/目录(该目录在我的服务器上不存在,但我假设它是寻找漏洞的黑客机器人)中,我收到了大量来自网络爬虫机器人的请求。IP都是完全不同的,所以我不能阻止IP。我是否可以使用htaccess向任何试图访问该文件夹和/或禁止该IP多次尝试的机器人发送403错误?
浏览 2
提问于2013-05-15
得票数 0
1
回答
这段robot.txt代码会禁止所有的搜索引擎吗?
、
、
User-agent: * 另外,此代码是否使用新的htlm5
协议
进行了更新?<META NAME="
ROBOTS
" CONTENT="NOINDEX, NOFOLLOW"> 真的有用还是不再需要了?
浏览 2
提问于2011-08-22
得票数 0
回答已采纳
3
回答
是否有默认的站点地图文件路径?若否,原因为何?
例如,机器人排除
协议
将/
robots
.txt指定为文件路径。若否,原因为何?
浏览 0
提问于2019-12-11
得票数 1
1
回答
谷歌是否尊重将
robots
.txt的头重定向到不同的文件名?
、
、
、
对于
robots
.txt请求,Google 州“通常会遵循重定向,直到找到有效的结果”。这是否意味着,如果我为http://www.example.com/
robots
.txt创建一个301重定向到http://www.example.com/myrobots.txt,谷歌将解析http://www.example.com/myrobots.txt提供的内容为有效的
robots
.txt内容?或者结果URL未命名为
robots
.txt这
浏览 0
提问于2013-08-01
得票数 4
1
回答
场外商店网站地图
、
我们有Nginx网络服务器。以及我们每周制作的地图.我在这方面找不到多少资源。你怎么解决这个问题?
浏览 0
提问于2013-12-04
得票数 1
2
回答
如何禁止www.example.com和exsample.com中的搜索机器人
、
robots
.txt检查工具说,我在exsample.com上没有
robots
.txt文件,但在www.exsample.com上有。 希望有人能帮我:)
浏览 4
提问于2014-09-04
得票数 0
回答已采纳
1
回答
有没有办法用tomcat实现X-
Robots
-Tag指令?
、
、
、
、
我想将X-
Robots
-Tag noindex, nofollow添加到站点的所有.PDF文件的超文本传输
协议
响应中,以避免这些文档被谷歌搜索引擎引用。<Files ~ "\.pdf$"></Files>
浏览 16
提问于2019-06-11
得票数 2
回答已采纳
1
回答
Robots
.txt阻止除所选页面外的所有页面
Allow: /sitemap.xmlAllow: /some-other-page 在通过谷歌站长工具手动提交网站地图后,它说无法读取被允许的页面,因为它们被
robots
.txt如何修改
robots
.txt,以允许对它们进行索引,而不对其余门户页面进行索引?
浏览 0
提问于2014-12-17
得票数 0
2
回答
如何才能让网站的某些部分不会出现在搜索引擎结果中?
、
如何才能让网站的某些部分不会出现在搜索引擎结果中?
浏览 2
提问于2010-05-27
得票数 0
回答已采纳
2
回答
.htaccess中的RewriteRule Apache指令不起作用
、
、
、
、
$
robots
-https.txt [L] RewriteCond %{REQUEST_FILENAME} !$
robots
-https.txt [L] RewriteCond %{REQUEST_FILENAME} !$
robots
-https.txt [L] RewriteEngine On RewriteCond %{HT
浏览 2
提问于2014-07-13
得票数 0
2
回答
Googlebot能用302重定向处理
robots
.txt吗?
、
、
在Google网站管理员工具中,我得到了一个错误:相关的帮助说:我的站点302将所有http流量重定向到HTTPS --所以访问http://blah/
robots
.txt的权限是302重定向到https://blah/
robots
.txt
浏览 0
提问于2013-11-19
得票数 2
1
回答
Django :防止搜索引擎为内部页面/链接编制索引
、
我有一个Django项目,其中我有内部页面来监视数据。我不想让搜索引擎对这些网页进行索引,也不想透露到互联网的链接。能否做到这一点?
浏览 1
提问于2015-09-23
得票数 0
1
回答
使用使用Jsoup.connect()或其他技术的网站,但这是否合法?
、
当我们使用Jsoup或任何其他技术请求使用我们的代码安全时,这是有效的还是合法的? 谢谢。
浏览 2
提问于2017-05-13
得票数 0
回答已采纳
1
回答
使用valueForKeyPath获取NSImageView子类数组的最小x和y原点
、
我试过了:以及:然而,我得到了以下错误: [<NSConcreteValue 0x100597a20我已经搜索了互联网和NSKeyValueCoding
协议
参考,但我没有找到我的
浏览 0
提问于2013-02-04
得票数 1
回答已采纳
3
回答
停止Google显示我的网站的缓存副本
我可以给出一些指令,让谷歌扫描我的网站,但不允许用户在点击谷歌搜索页面上的“缓存”链接时看到缓存版本吗?
浏览 6
提问于2009-08-20
得票数 4
回答已采纳
1
回答
无法使用lambda访问远程文件
、
已验证的出站规则显示所有端口和
协议
均为0.0.0.0/0。已验证lambda.amazonaws.com是否为策略中的受信任实体。= nil { } res.Body.Close()= nil { }} 我在lambda中使用了“测试”函数,我得到的结
浏览 0
提问于2020-08-08
得票数 0
1
回答
站点地图
协议
子页面
、
、
我正在研读Sitemaps.org
协议
(),以便创建自己的
协议
。然而,有一个问题浮现在我的脑海中:我如何处理像这样的子页面?这样,我就可以在我的
robots
.txt中放置一个可转换为XML文件的*.php文件,供谷歌查找。或者我必须使用*.xml文件? 提前谢谢你,
浏览 0
提问于2013-01-31
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
robots协议是什么?对网站SEO有什么好处?
SEO优化:如何正确设置robots.txt协议文件?
ROBOTS怎么写?ROBOTS禁止收录写法、详细说明
网站建设完成后, 做seo必须知道的专业知识之--robots协议
SEO正式操作之robots.txt
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券